목록프로그래밍 (15)
매일 매일 미라클 코딩

웹 크롤링 (Crawling) : 페이지 자체를 다운로드, 수집 웹 스크랩핑 (Scrapping): 페이지에서 원하는 부분만 추출 일반적으로 둘을 합쳐 크롤링으로 통용되고 있다 오늘은 파이썬에서 제공하는 BeautifulSoup 라이브러리를 통해, 윤동주 시인의 작품 리스트를 가져오고자 한다. 위키문헌에서 윤동주 시인을 검색해 보았다. 일일이 받아쓰기엔 작품이 굉장히 많다. 하지만 이미 잘 정리된 데이터가 있으니 프로그래밍을 통해 이를 추출하면 될 것이다. 데이터 크롤링을 위해서는 웹에서 가져오고자 하는 데이터가 어떤 선택자에 의해 표현되고 있는지 알아야한다. F12 번을 눌러 페이지 소스를 확인한다. Element 탭 왼쪽의 버튼을 누르면 페이지 요소를 직접 눌러 태그를 확인할 수 있다. 작품 이름을 ..

서로 다른 사용자와 저장소를 공유하는 경우 이제 소스트리에서의 commit, push, pull 과정을 이해하였다. 그런데 여럿이서 작업하다보면 한 사람의 커밋과 푸쉬 사이에 다른 사람의 커밋과 푸쉬가 끼어드는 상황도 있지 않을까? 동기화 작업이 아니니 말이다 이를 확인하기 위해 깃헙 본계정과 부계정을 사용해 보았다. 현재 본계정은 - hong_bowang 저장소와, 제2의 계정은 - Jieun_bowang이라는 로컬 저장소와 연결되어있다. 본계정인 Jieun_h5ng 에서 보왕삼매론 TXT를 생성한뒤, 부계정으로 한글 글귀를 추가하였다. master 옆에 1이라는 숫자는 내가 github 원격저장소보다 한 버전 위라는 뜻이다. 즉 서버에 push할 내용이 있다는 뜻. 위 경우 commit 만 진행하고 ..

Git의 버전관리 과정은 이렇다 1. 서버의 update 상황을 먼저 PULL 해온다 2. 관리대상 폴더 내의 파일을 변경한다 3. 적용할 변경사항을 STAGE 에 올린다 4. COMMIT 하여 로컬 저장소에 저장 5. PUSH: 로컬저장소에 저장된 변경사항을 서버에 업로드 → 저장소 이중구조로 인해 중앙서버가 날아가더라도 push 를 통해 복원 가능하다 채근담 폴더에는 저장소 연결 후 아직 업데이트된 내용이 없으므로 Stage, Commit 부터 진행한다. 하지만 첫 연결 이후부터는 작업하기전 무조건 Pull 을 실행하여 혹시라도 업데이트 되어있을지 모를 프로그램에 누가 되지 않도록 한다. (중요) 1) 파일 업데이트 채근담 폴더에 txt 파일을 하나 추가해 보았다 소스트리에 들어가면 잠깐의 로딩 후 ..

프로젝트 돌입에 앞서 소프트웨어 버전관리 도구 중 하나인 Github 그리고 SourceTree 사용법을 정리하게 되었다. Git은 자료를 로컬 저장소와 서버저장소에 분산 관리한다. 그래서 서버에 문제가 생겨도 로컬 저장소를 통해 작업할 수 있다는 장점이 있다. 이러한 Git 서버를 웹에서도 사용할 수 있게 해준 것이 gitHub 서비스이다. 브라우저 2개 (크롬, 엣지) 와 gitHub 계정 두개, gmail 두개를 준비하여 test 해보았다. (Git 서버와 소스트리를 먼저 설치하고 진행하였음) 우선 로컬 저장소를 지정하는 방법이다. 나의 경우는 Test 용 폴더 내의 채근담 폴더를 로컬 저장소로 지정하였다. chaegeundam 폴더 우클릭 > git bash here 쉘에 master 이라는 표시..