티스토리 뷰
[데이터 읽고 쓰기]
1. 크롤링을 통해서 네이버 지식백과에서 금융단어를 csv파일로 저장하는 과정을 거침
1) request와 bs4를 사용해서 html 파일을 크롤링할 사이트의 url에서 가져오고 soup에 담아놓고 데이터를 조작.
=> 금융단어와 금융단어에 대한 의미를 뽑아내기위한 코드 일부
result = soup.select("#content div.list_wrap>ul>li>div.info_area>div.subject>strong>a")
result2 = soup.select("#content div.list_wrap>ul>li>div.info_area>p")
=> result를 활용해서 단어의 뜻을 가져올 예정이고 result2를 통해서 단어의 의미를 crawling을 통해서 저장함.
2) 이후 원하는 값만 뽑아내는 코드를 작성하여서 name과 meaning의 정보만 데이터 프레임에 저장
=> tag의 text정보만 불러오기 위해서는 get_data()를 사용해야함.

2. 저장된 데이터들을 불러와서 서로 다른 값으로 random 하게 값을 뽑아내고 난수생성 모듈 random을 import해서 사용해 보여줄 데이터 5개의 index값울 뽑아냄.
1) csv파일을 읽어와서 name과 meaning별로 list에 저장함
=> pandas의 read_csv를 활용
words = pd.read_csv("C:\\project\\finance\\data\\단어사전크롤링.csv")
word_name = words['name'].to_list()
word_meaning = words['meaning'].to_list()
2) random 라이브러리를 활용해서 random.randrange를 사용해 for문을 5번 돌리며 없는 index라면 list에 저장.
for i in range(0,5):
while num in word_index:
num = random.randrange(0,len(words))
word_index.append(num)
3) index번째의 단어와 그에대한 의미를 사용할 수 있음.

'기획' 카테고리의 다른 글
[금융단어암기장] QUIZ 기능추가 (0) | 2021.12.19 |
---|---|
byeBlue-(2) [django를 활용한 게시판기능구현] (0) | 2021.08.17 |
게시판만들기(4) - flask를 활용한 기능구현 (0) | 2021.06.13 |
게시판만들기(3) - class diagram (0) | 2021.05.31 |
게시판 만들기(2) - UI (0) | 2021.05.27 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 영화 리뷰 긍정 부정 분류
- 백트래킹(1)
- 10866 백준
- 핀테크 트렌드
- 기본 텍스트 분류
- 딥러닝입문
- stack 컨테이너
- CREATE ASSERTION
- 백준 11053 파이썬
- LAMBDA
- 백준 4963
- 기사작성 대외활동
- 4963 섬의개수
- 스택 파이썬
- 백준 15650 파이썬
- 코딩월드뉴스
- c++덱
- 모듈 사용법
- 시뮬레이션 c
- 소프트웨어공학설계
- 효율적인방법찾기
- 온라인프로필 만들기
- mm1queue
- 백준 숫자놀이
- DRF 회원관리
- 11053 백준
- 13886
- CSMA/CD란?
- 파이썬 알아두면 유용
- 백준 10866
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함