카테고리27 K-Nearest Neighbor Code Example(K-NN - Titanic 생존자 예측) K-NN을 이용한 Titanic의 생존자 예측하기 오늘은 K-NN을 이용해 타이타닉호의 생존자를 예측하는 코드를 작성해보도록 하겠습니다. 데이터는 (Kaggle)에서 가져왔습니다. 실험환경은 이전과 같이 Jupyter Notebook에서 작성하였습니다. Library Import, 데이터 불러오기 import numpy as np import pandas as pd %matplotlib inline 데이터 불러오기 #경로의 경우 사용자의 환경에 맞게 설정해 주셔야 합니다. data=pd.read_csv('C:/Users/User/Downloads/train.csv') data 불러온 데이터를 한번 살펴보겠습니다. Pclass - 승선자의 사회-경제적 지위(낮을수록 높은 지위를 가지고 있음) SibSp -.. 2023. 1. 19. 바삭한 인공지능(비지도 학습 / 강화학습) 목차 1. 머리글 2. 비지도학습이란? 3. 비지도학습의 종류 4. 군집화 알고리즘의 종류 5. 시각화 및 차원축소 알고리즘의 종류 6. 연관규칙학습 알고리즘 7. 강화학습 8. 강화학습과 지도/비지도학습의 차이 9. 마치며 안녕하세요. 오션라이트에이아이 백승기연구원입니다. 머리글 오늘은 비지도학습(Unsupervised Learning)에 대해서 알아보겠습니다. 비지도학습이란? 비지도학습이란 주어진 데이터(X)에 대한 레이블(Y)을 사용자가 정해주지 않고 컴퓨터가 X에 대한것만 학습한 뒤, 학습한 결과를 토대로 컴퓨터 스스로 상관관계나 특성을 찾아내게 하는 방법을 말합니다. 그림 1.과 같이 Input Data에 대해 라벨링을 제공하지 않고 컴퓨터가 학습을 통해 스스로 데이터들의 특성을 파악해서 비슷한.. 2023. 1. 17. 바삭한 인공지능(분류알고리즘 종류) 목차 1. 머리글 2. K-Nearest Neighbor(KNN) 3. Decision Tree 4. Random Forest 5. Naive Bayes 6. Support Vector Machine(SVM) 7. 마치며 안녕하세요. 오션라이트에이아이 백승기연구원입니다. 머리글 이번 글은 분류 알고리즘의 종류에 대해서 좀 더 알아보도록 하겠습니다. K-Nearest Neighbor(KNN) K-NN 알고리즘은 판별하고 싶은 데이터와 인접한 K개수의 데이터를 찾아, 해당 데이터의 라벨이 다수인 범주로 데이터를 분류하는 방식입니다. K값에 따라서 주어진 데이터의 라벨이 달라질 수 있기 때문에 K를 적절하게 조정하는것이 필요합니다. 또한 K가 짝수일 경우 범주 내의 데이터가 같아져서 분류가 불가능한 상황이 올.. 2023. 1. 11. Linear Regression Code Example Linear Regression Code Example 선형회귀 모형을 알아보기 위한 간단한 코드 예시 입니다. 모델 학습 환경은 Jupyter Notebook을 이용하였습니다. sklearn 라이브러리를 통해 간단한 회귀 예측을 해보겠습니다. 라이브러리 불러오기 from sklearn.linear_model import LinearRegression import pandas as pd import matplotlib.pyplot as plt 키와 몸무게가 들어있는 파일 준비 # 파일 경로의 경우 사용자의 경로에 맞게 수정해주셔야 합니다. df = pd.read_csv("C:/Users/User/Downloads/height_weight.csv") 위의 데이터는 kaggle(https://www.kagg.. 2023. 1. 11. 바삭한 인공지능(ML 이란? / 회귀와 분류) 목차 1. 머리글 2. 머신러닝이란? 3. 머신러닝의 알고리즘 분류 4. 지도학습(Supervised Learning) 5. 지도학습 - 회귀(Regression) 6. 지도학습 - 분류(Classification) 7. 분류 알고리즘의 종류 8. 마치며 안녕하세요. 오션라이트에이아이 백승기연구원입니다. 머리글 이번에는 머신러닝(Machine Learning, ML)에 대해서 좀 더 알아보도록 하겠습니다. 머신러닝이란? 머신러닝은 주어진 데이터의 상관관계를 컴퓨터가 학습한 후 그 결과를 토대로 새로운 데이터에 대한 관계를 예측하는 능력을 가지게 하는 것을 말합니다. 다음은 Tom Mitchell의 머신러닝에 대한 정의 입니다. Tom Mitchell(1998) - Machine Learning is We.. 2023. 1. 11. 바삭한 인공지능(분산처리기술) 목차 1. 머리글 2. 분산처리기술이란? 3. 분산처리기술을 사용하는 이유 4. 하둡(Hadoop)이란? 5. 하둡 분산형 파일시스템(HDFS) 6. HDFS의 특징 7. HDFS의 아키텍처(Architecture) 8. 맵리듀스(Map Reduce) 9. 마치며 안녕하세요. 오션라이트에이아이 백승기연구원입니다. 머리글 오늘은 분산처리기술에 대해서 알아보겠습니다. 분산처리기술이란? 분산처리기술은 많은양의 데이터, 즉 빅데이터의 처리를 하기 위해 발전한 기술입니다. 분산처리기술은 하나의 업무를 수행하기 위해서 서로다른 장소에 위치한 컴퓨터시스템에 기능과 자원을 분산시켜 협력하게 만드는 시스템입니다. 물리적으로는 떨어져 있는 컴퓨터들이 네트워크를 통해서 협력하며 이전보다 빠르고 정확한 데이터 처리업무를 수행.. 2023. 1. 11. 바삭한 인공지능(빅데이터의 종류) 목차 1. 머리글 2. 빅데이터의 종류 3. 정형데이터 4. 비정형데이터 5. 반정형데이터 6. 데이터의 수집위치에 따른 분류 7. 내부데이터 8. 외부데이터 9. 마치며 안녕하세요. 오션라이트에이아이 백승기연구원입니다. 머리글 이전 글에서 설명하였던 빅데이터를 좀 더 자세히 알아보도록 하겠습니다. 빅데이터의 종류 빅데이터는 정형데이터, 비정형데이터, 반정형데이터 세가지로 나눌 수 있습니다. 정형데이터 먼저 정형데이터에 대해서 알아보도록 하겠습니다. 정형데이터는 데이터를 미리 정해놓은 형식과 구조에 따라 저장되도록 구성하여 고정된 필드에 저장된 데이터를 말합니다. 정형데이터는 손쉽게 데이터에 대한 부분검색 및 선택, 갱신, 삭제 등의 연산을 수행할 수 있습니다. 그림 1.과 같이 데이터의 구조가 정형화 .. 2023. 1. 11. 바삭한 인공지능(인공지능과 빅데이터) 목차 1. 머리글 2. 빅데이터(Big Data)란? 3. 빅데이터의 등장으로 인한 이점 4. 인공지능과 빅데이터의 관계 5. 빅데이터의 특성(5V) 6. 마치며 안녕하세요. 오션라이트에이아이 백승기연구원입니다. 머리글 이번 글에서는 빅데이터에 대해서 알아보고 빅데이터와 인공지능과의 관계 그리고 빅데이터의 특성들에 대해서 이야기하도록 하겠습니다. 빅데이터(Big Data)란? 인공지능을 얘기하면서 빠질 수 없는 주제가 하나 있는데 바로 빅데이터입니다. 빅데이터(Big Data)는 정제되지 않은 방대하고 복잡한 자료의 모음이며 인공지능이 발전함에 따라 그 중요성이 더욱 부각되고 있습니다. 지금 이 순간에도 새로운 데이터들이 생겨나고 사라지고 있기 때문에 기존의 전통적인 데이터 처리방식으로는 방대한 양의 데.. 2023. 1. 11. 바삭한 인공지능(AI, ML, DL에 대하여...) 목차 1. 머리글 2. 인공지능(AI)이란? 3. 머신러닝(ML)이란? 4. 딥러닝(DL)이란? 5. 인공지능, 머신러닝, 딥러닝의 관계 6. 우리 주변의 인공지능? 7. 마치며 안녕하세요. 오션라이트에이아이 백승기연구원입니다. 오늘부터 인공지능에 관련된 정보와 기술을 다루는 내용을 작성하고자 합니다. 머리글 먼저 인공지능(AI)과 머신러닝(ML), 딥러닝(DL)에 대해서 간략하게 설명하고 세 가지 개념의 관계에 대해서 얘기해 보겠습니다. 인공지능(AI)이란? 인공지능(AI)은 Artificial Inteligence의 약자로 컴퓨터나 기계장치에 인간의 학습능력, 추론능력, 지각능력, 언어 이해능력 등을 구현한 기술입니다. 인공지능은 사람이 컴퓨터에다가 지식이나 기술을 입력하고 컴퓨터는 상황에 따라 입력.. 2023. 1. 11. 이전 1 2 3 다음