목록Language/Python (3)
Coding Memo
※ 이 글은 '웹 크롤러 대마왕' 관련 강의를 듣고 메모한 내용이다. BeautifulSoupt 라이브러리(module) 설치: pip install beautifulsoup4 웹 상에서 html의 내용을 가져올 수 있는 기능을 제공하는 라이브러리로, HTML parser이명 XML 문서도 파싱할 수 있다. 안드로이드에서 사용했던 jsoup으로 html, xml, json을 파싱하는 것과 비슷한 것 같다. https://www.crummy.com/software/BeautifulSoup/ Beautiful Soup: We called him Tortoise because he taught us. www.crummy.com Selenium & Web driver 웹을 crawling 하기 위해서는 셀레니움..
트위터 크롤링 방법 1. 트위터 계정 필요 (개발자 인증 따로 필요) developer.twitter.com/en Use Cases, Tutorials, & Documentation Publish & analyze Tweets, optimize ads, & create unique customer experiences with the Twitter API, Twitter Ads API, & Twitter for Websites. Let's start building. developer.twitter.com 이것저것 작성할 것들이 있다. 핸드폰 번호 인증이 필요한 것 같고 개발자 계정을 어떻게 사용할 건지 간단하게 영어로 표기하면 된다. 2. 그 계정으로 부터 API Key(Consumer key), AP..
선형대수학에서 Discrete Wavelet Transform (DWT)에 대한 이미지 압축 관련으로 코딩한 것이 있다. 이미지를 행렬로 변환 시킨 뒤, Harr Matrix를 이용해 고주파와 저주파 성분을으로 나눈 다음 고주파 성분은 빼버리고 나머지 저주파 성분으로만 이미지를 저장시켜서 이미지의 용량을 줄이는 과정을 해보았다. 이는 실제로 JPEG 압축에서 쓰이는 방식이라고 하고 이미지를 보통 8*8로 잘라서 압축한다고 한다. Haar Matrix를 만들기 위해서 다음의 URL를 참고 했다. stackoverflow.com/questions/23869694/create-nxn-haar-matrix Create NxN Haar Matrix I can't find a definition for genera..