목록알고리즘/PYTHON (14)
매일 매일 미라클 코딩
딥러닝에 많이 쓰이는 파이썬 라이브러리 NumPy : 숫자를 다루는 파이썬 패키지다 라는 뜻. 통계정보 갖고있음 Pandas : 테이블 형태의 데이터를 가공하고 싶을 때 import numpy as np # 1) 배열 생성 data1 = [0, 1, 2, 3, 4, 5] a1 = np.array(data1) print(type(a1)) print(a1) data2 = [0.1, 5, 4, 12, 0.5] a2 = np.array(data2) print(a2) print(a1.dtype) print(a2.dtype) a3 = np.array([0.5, 2, 0.01, 8]) print(a3) print(a3.dtype) a4 = np.array([[1,2,3],[4,5,6],[7,8,9]]) print(a..

웹 크롤링 (Crawling) : 페이지 자체를 다운로드, 수집 웹 스크랩핑 (Scrapping): 페이지에서 원하는 부분만 추출 일반적으로 둘을 합쳐 크롤링으로 통용되고 있다 오늘은 파이썬에서 제공하는 BeautifulSoup 라이브러리를 통해, 윤동주 시인의 작품 리스트를 가져오고자 한다. 위키문헌에서 윤동주 시인을 검색해 보았다. 일일이 받아쓰기엔 작품이 굉장히 많다. 하지만 이미 잘 정리된 데이터가 있으니 프로그래밍을 통해 이를 추출하면 될 것이다. 데이터 크롤링을 위해서는 웹에서 가져오고자 하는 데이터가 어떤 선택자에 의해 표현되고 있는지 알아야한다. F12 번을 눌러 페이지 소스를 확인한다. Element 탭 왼쪽의 버튼을 누르면 페이지 요소를 직접 눌러 태그를 확인할 수 있다. 작품 이름을 ..