일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- Computer Vision
- 회귀
- filtering
- 크롤러
- 인공지능
- 42경산
- 딥러닝
- 자연어처리
- Flutter
- Regression
- 코딩애플
- map
- 선형회귀
- 선형대수학
- 플러터
- RNN
- AI
- 데이터분석
- CV
- 앱개발
- 피플
- mnist
- 모델
- 지정헌혈
- 크롤링
- 유데미
- 파이썬
- 42서울
- pytorch
- 머신러닝
Archives
- Today
- Total
목록bag of words (1)
David의 개발 이야기!
Bag of Words(BoW)에 대해 알아보자
1. Bag of Words 란 단어들의 순서는 전혀 고려하지 않고, 단어들의 출현빈도(frequency)에만 집중하는 텍스트데이터의 수치화 표현 방법이다. BoW를 직역하면, 단어들의 가방이라는 뜻으로, 어떤 텍스트의 단어들을 전부가방에 넣고, 섞었을때, 해당 가방에서, 특정 단어가 N번 등장했다면, 해당 문서에는 그 특정 단어가 N개 있다고 생각하는 것이다. (단어의 순서는 섞어서 진행했기에 중요하지 않다.) BoW를 만드는 과정은 아래와 같다. (1) 각 단어에 고유한 정수 인덱스를 부여합니다. # 단어 집합 생성. (2) 각 인덱스의 위치에 단어 토큰의 등장 횟수를 기록한 벡터를 만들기 2. 기본 구현 코드 from konlpy.tag import Okt okt = Okt() def build_b..
자연어처리
2023. 8. 9. 17:21