반응형

웹문서를 PDF로 변환해 저장해야할 때가 있습니다. 이럴때를 위해 준비된 Python 라이브러리를 소개합니다.

import pdfcrowd
import sys

오늘 사용될 라이브러리는 pdfcorwd 로 https://pdfcrowd.com/doc/api/html-to-pdf/python/자세한 사용법은 하단 링크를 확인하시면 됩니다.

 

HTML to PDF API for Python | Pdfcrowd

top Set the output page top margin. Can be specified in inches (in), millimeters (mm), centimeters (cm), or points (pt). Default: 0.4in right Set the output page right margin. Can be specified in inches (in), millimeters (mm), centimeters (cm), or points (

pdfcrowd.com

import pdfcrowd
import sys

try:
    #자신이 원하는 이름을 사용하고싶다면, 사이트의 회원가입이 필요합니다.
    client = pdfcrowd.HtmlToPdfClient('demo', 'ce544b6ea52a5621fb9d55f8b542d14d')

    output_file = open('leo_bb.pdf', 'wb')

    #변환하고자하는 웹사이트의 url을 입력합니다.
    pdf = client.convertUrl('https://leo-bb.tistory.com/')

    output_file.write(pdf)

    output_file.close()
except pdfcrowd.Error as why:
    
    #에러 발생시 어떠한 에러가 발생했는지 알려주며, 해당 사이트를 참고하여 해결할 수 있습니다.
    sys.stderr.write('Pdfcrowd Error: {}\n'.format(why))

    raise

 

 

직접 PDF로 변환하는 코드를 짜기 어려우시거나 내용만 확인이 가능하면 된다고 생각하시는 분들은 pdfcrowd 라이브러리로도 충분히 만족하실 것으로 생각됩니다.

반응형
복사했습니다!