본문 바로가기

Tutorial

[트위터API] 파이썬으로 트위터 크롤링하기

반응형

이번 포스팅은 트위터에서 크롤링하는

튜토리얼을 포스팅한 글입니다.

 

 

 

 

트위터 회원가입 후 개발자 등록

- 아래 링크로 들어가 회원가입 후 개발자 페이지에서 개발자 등록

https://developer.twitter.com

 

Developer

Tap into what's happening. Publish and analyze Tweets, optimize ads, and create unique customer experiences.

developer.twitter.com

 

 

 

- 개발자 신청 후 이메일로 가서 컨펌을 하면 개발자로 등록이 완료

 

- 다시 개발자 홈페이지로 접속하면 아래와 같이 get started 확인 가능

 

 

앱 등록

- create app으로 들어가서 새로운 앱을 생성한다

- 앱 생성을 완료한 후, Keys and tokens을 확인하면 키와 토큰을 발급받은 것을 확인할 수 있다

 

 

 

라이브러리 설치

$ pip install tweepy

- 트위터 크롤링 방법에 여러 가지가 있는데 그중에서 tweepy 사용을 위해 필요한 패키지를 다운로드한다

 

 

기본 사용법 (특정 검색어 추출)

import tweepy

#트위터의 개인 앱 계정에서 아래 4가지 사항 확인
consumer_key = ""
consumer_secret = ""
access_token = ""
access_token_secret = ""


#계정 승인
auto = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
twitter_api = tweepy.API(auth)


#검색 키워드 정의
keyword = "한정판"
api_result = []


#키워드 검색 및 결과
tweet = api.search(keyword)
for tw in tweet:
    api_result.append(tw.text) #텍스트 결과만 담기

- 텍스트 결과가 아닌 전체 데이터를 담을 경우, 하나의 검색 결과에 아래와 같은 많은 내용을 포함한다

- 이 중에서 실제로 필요한 텍스트 결과만 가져오기 위해 ".text" 를 활용한다

반응형