- 카테고리
- 개발
- 등록일
- 2022.11.22
[개발] 내손으로 자연어처리 with Python | 감정분류와 포털뉴스 검색 프로젝트
- 저자명
- 파트너사
- 코딩엑스AI
내손으로 자연어처리
with Python
| 감정분류와 포털뉴스
검색 프로젝트
사례를 통해 배우는 이론과 직접
내손으로 구현하는 NLP 프로젝트
텍스트 데이터의 유사도를 표현하는 TF-IDF의 이론과 실습을 통한 이해를 배우게 됩니다.
같은 단어의 수와 형태소 등 다양한 방법으로 유사도를 판단하는 접근을 배우게 됩니다.
텍스트를 벡터화 한 후 각 문장 간의 유사도를 측정하는 딥러닝 기반 방법을 배우게 됩니다.
자카드 유사도, 코사인 유사도, 유클리디언 유사도, 맨하탄 유사도 등
영화 리뷰 데이터, RSS 포털 뉴스 검색기 등 실제 프로젝트를 통해 NLP 기본 기술을 배우게 됩니다.
고려대학교 전기전자공학부 교수
고려대학교 인공지능 및 모빌리티 연구실고려대학교 석탑강의상 (2019)
중앙대학교 컴퓨터공학부 교수 (2016-2019)
미국 인텔 연구원 (2013-2016)
University of Southern California 박사 (2013)
LG전자 연구원 (2006-2009)
IJCAI, ICDCS 등 인공지능 분야 최우수 학술대회 및 국제 최고 저널 논문 100여편 게재
텍스트를 이용한 자연어 처리의 원리와 프로젝트를 경험해보고 싶은 학습자
포털뉴스 검색기, 영화 리뷰 데이터 처리 등 데이터 분석의 기초를 경험해보고 싶은 학습자
초급자를 위해 준비한 Python 언어로 배우는 자연어 처리 강의입니다.
강의 한줄 소개
- 인터넷 페이지, 다양한 문서 등 텍스트에서 유사도를 판단하고 분류하는 자연어처리 기술을 다루는 강의입니다.
내손으로 체화하는 파이썬 실습
- Google Colab으로 복잡한 설치 없이 간편하게 실습합니다.
- 파이썬 개발환경에서 데이터를 가져오는 다양한 방법(zip 파일 읽기, 경로를 찾아 다운로드 받기 등)
- 인공지능/데이터사이언스에서 자주 사용하는 패키지(scikit-learn, Keras, TF, numpy 등)을 경험합니다.
- 영화 리뷰를 하나의 데이터로 긍정/부정을 분류하는 프로젝트를 구현합니다.
- 포털뉴스에 자주 사용되는 RSS 데이터 중 원하는 기사를 검색하는 프로젝트를 구현합니다.
핵심 내용
자연어 기초 이론
- 딥러닝 기반 자연어 처리 개념
- 웹 문서에서 자연어 추출하기
- 추천 및 검색 시스템의 기초
- 워드 임베딩(Word- to Vector)
텍스트의 이해
- 파이썬 함수로 데이터 전처리하기
- 문장 전처리 및 데이터 시각화
감정분류기 설계
- 데이터 전처리 구현, 실제 데이터로 구현하는 프로젝트
신문기사 검색엔진
- 검색엔진 개요와 검색 기본함수
- 데이터 전처리
- 신문기사 검색기 구현 및 응용
