티스토리 뷰

안내
[학습 메모장]은 작성자가 수강하는 강좌의 내용을 메모합니다.
따라서 부정확하고 가독성이 좋지 않습니다.

1강. 강의 소개

데이터 엔지니어링 / 데이터 사이언스 입문 과목

데이터를 다루기 위한 기초 과목으로 개념적인 요소를 다룸 (개념 + 수학 과목)

 

데이터는 개수(amount)와 속성(attribute)

 

데이터가 의미를 가질려면 양(amount)이 있어야 함. (한 명의 체중은 의미가 없지만, 최소 한 반의 체중은 A반의 체중이라는 의미를 가짐)

데이터 필드가 2개 이상이면 파생이 나옴 (체중 데이터와 키 데이터로 상관 관계 및 체격을 유추할 수 있음)

 

빅데이터 : 양이 많고, 속성도 많은 데이터

라지데이터 : 양만 많꺼나, 속성만 많은 데이터

 

[중간고사 이전]

data quantitiy (데이터 수량)

quantitiy 서머리 - 통계적 방법으로

가장 간단한 것이 평균(평균은 정규분포어야 의미를 가짐)

즉 대표성은 수량을 축약하는 것 : 

본 강의는 통계적 모델을 학습하는 것이 아닌  아닌 고유의 성격을 끌어내고, 해석하는 방법을 배울 것임.

 

평균 / 분산

k-means, k-medoids clustering (과제 후보)

(찾아본 자료 : https://bkshin.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-7-K-%ED%8F%89%EA%B7%A0-%EA%B5%B0%EC%A7%91%ED%99%94-K-means-Clustering)

 

[중간고사 이후]

데이터 차원 (Dimension) : 공간 내 점의 위치를 알아내기 위한 필요한 축의 개수

데이터의 관계 속성을 나타내기 위해 사용한다.

 

속성이 한 개면 실수

속성이 두 개면 복소수

속성이 세 개면 백터

메트릭스를 사용한다. (그렇기에 선형대수학 - 메트릭스를 기본 지식으로 알아야 함)

 

차원 핸들링

- 체격은 키와 몸무게 속성으로부터 알 수 있다 (사는 곳 데이터 무의미)

차원 축소 (Dimension reduction)

- 필요 없는 에트리뷰트 버리고, 필요한 것만을 뽑아내는 것. 수학/개념

 

차원 축소와 PCA (과제 후보)

(찾아본 자료 : https://bkshin.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-9-PCA-Principal-Components-Analysis?category=1057680)

 

  • 과제는 clustering나 PCA를 이해할 수 있는 3,4일 정도의 분량의 과제를 낼 것

(라이브러리 미 사용 시 최대 만점 가능 / 라이브러리 사용시 50점이 최대 / 사용했으나 작동하지 않으면 80점)

 

인지, 지능 그리고 데이터

인지 과학 (cognitive Science) : 인식과 지능 문제를 다루는 포괄적 과학 분야 - 사람을 다루는 과학(뇌에서 일어나는 활동)

인공 지능 (artificial intelligence) : 인간의 학습 능력과 추론 능력을 인공적으로 모델링하여 컴퓨터로 구현하는 기술(배우지 않은 것을 안 것으로부터 추론)

패턴 인식 (pattern recognition) : 컴퓨터가 어떤 대상을 인식하는 문제를 다루는 인지 과학과 인공지능의 한 분야 (창조 이전 단계)

머신 러닝 (machine learning) : 데이터로 패턴을 찾는 것

데이터 과학 (Data Science) : 데이터를 가공하여 내용과 지식을 끌어내는 포괄적 과학 방법론 (통계론적 접근 방법)

 

인지과학 > 인공 지능 > 패턴 인식 > 머신 러닝 (데이터 과학은 별개 분야로 머신 러닝을 위해 차용됨)

인텔리젠스 (말로 표현 가능) / 이모션 (말로 표현 못함)

본 과목은 학습에 필요로 하는 시간이 많아 고통스러운 과목임

 

사람의 인지

- 사진을 보면 어떻게 인지하는가

감각 Sensation : 눈으로 빛을 인지

지각 Perception : 대외 피질이 윤각선(Edge)을 인지

인식 Cognition : 기초적 인지로 사람의 얼굴, 여자라는 것을 인지

재인 Recognition : 수지 사진이라는 것을 인지 (이전에 수지 사진을 본 적이 있음)

추론 Inference : 사진의 의도성, 메시지를 이끌어내는 것 ( 영화에서 연출된 장면이다, 은연중에 깔린 새로운 사실을 끌어내는 것)

감성 Emotion : 아름다움

 

이 강의는 가장 기본적인 것부터 배운다. 즉 픽셀(RGB)이 우리의 데이터가 되어 데이터를 가공하는 것을 배운다.

 

궁금한 점

- 속성 (attribute)와 특징(feature)의 차이가 뭔지?

 

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/02   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28
글 보관함