반응형
웹문서를 PDF로 변환해 저장해야할 때가 있습니다. 이럴때를 위해 준비된 Python 라이브러리를 소개합니다.
import pdfcrowd
import sys
오늘 사용될 라이브러리는 pdfcorwd 로 https://pdfcrowd.com/doc/api/html-to-pdf/python/자세한 사용법은 하단 링크를 확인하시면 됩니다.
import pdfcrowd
import sys
try:
#자신이 원하는 이름을 사용하고싶다면, 사이트의 회원가입이 필요합니다.
client = pdfcrowd.HtmlToPdfClient('demo', 'ce544b6ea52a5621fb9d55f8b542d14d')
output_file = open('leo_bb.pdf', 'wb')
#변환하고자하는 웹사이트의 url을 입력합니다.
pdf = client.convertUrl('https://leo-bb.tistory.com/')
output_file.write(pdf)
output_file.close()
except pdfcrowd.Error as why:
#에러 발생시 어떠한 에러가 발생했는지 알려주며, 해당 사이트를 참고하여 해결할 수 있습니다.
sys.stderr.write('Pdfcrowd Error: {}\n'.format(why))
raise
직접 PDF로 변환하는 코드를 짜기 어려우시거나 내용만 확인이 가능하면 된다고 생각하시는 분들은 pdfcrowd 라이브러리로도 충분히 만족하실 것으로 생각됩니다.
반응형