How to find fulfilling work

쳇바퀴 같은 일터에서 벗어나는 법과 삶에서 성취감을 얻으며 살아가는 방법을 찾는 여정

AI & 자동화

뉴스의 본문을 읽고 요약하는 API 활용 (Article Extractor)

초록콧물 2025. 2. 19. 00:02
반응형

 

지난 글에서는 뉴스 검색 결과를 가져오는 API에 대해서 알아보았습니다. 

 

구글 검색결과를 활용할 때 SerpAPI를 활용해야 하는 이유

인터넷에서 정보를 찾을 때, 우리는 대부분 구글 검색을 이용합니다. 하지만 수동 검색이 아니라 프로그래밍을 통한 자동화된 방식으로 구글 검색 결과를 활용해야 할 때는 어떻게 해야 할까요?

greentresure.com

 

위 글에서 다뤘던 API들은 검색의 결과를 가져오는데는 유용하지만, 세부 본문 내용을 가져오지 못한다는 단점이 있습니다. News를 가져온다고 했을때 확인할 수 있는 항목은 title, link, snippet, data, source, imageUrl 정도로 제한됩니다.

 

 

RapidAPI

위와 같이 제한된 API에서 조금더 확장성 있는 API들이 모여있는 RapidAPI를 소개합니다. RapidAPI는 다양한 API를 검색하고 사용할 수 있는 API 마켓플레이스야. 개발자들이 여러 서비스의 API를 한곳에서 찾고, 테스트하고, 구독할 수 있도록 도와주는 플랫폼입니다.

 

주요 기능:

  • API 검색: 전 세계에서 제공되는 다양한 API를 카테고리별로 검색
  • 테스트 및 문서 제공: API 요청을 직접 테스트하고, 공식 문서를 참고 가능
  • 구독 및 결제: 무료 또는 유료 API를 구독해서 사용할 수 있고, 요금제도 선택 가능
  • API 배포 및 관리: 개발자들은 자신이 만든 API를 등록하고 관리 가능

즉, 개발자들이 여러 API를 한곳에서 편하게 관리할 수 있도록 도와주는 플랫폼이라고 보면됩니다.

 

유사한 사이트 들로는 RapidAPI, Postman API Network, AWS API Gateway등이 있으며, 장단점은 아래와 같습니다.

 

[RapidAPI]

장점:

 - API 검색이 쉽고, 요청을 바로 테스트할 수 있음

 - 다양한 무료 API 제공

 - 코드 샘플 자동 생성 (Python, JavaScript 등)

단점:

 - 일부 유료 API는 무료 플랜이 제한적

추천 이유: 초보자가 다양한 API를 직접 테스트하고 실습하기에 최적

 

[Postman API Network] 

장점:

 - Postman 앱을 사용하면 API 요청을 쉽게 테스트할 수 있음

 - API 문서가 잘 정리되어 있어 학습하기 좋음

 - API를 직접 만들고 관리하는 기능도 제공

단점:

 - 초반에 UI가 조금 복잡해 보일 수도 있음

추천 이유: API 요청 실습에 최적이며, UI가 익숙해지면 API 개발과 테스트까지 확장 가능

 

Article Extractor

Article Extractor API는 웹사이트나 뉴스 기사에서 중요한 콘텐츠(본문, 제목, 이미지 등)를 추출하는 기능을 제공하는 API입니다.

📌 Article Extractor API가 하는 일

  • 웹페이지에서 핵심 내용만 추출 → 광고, 사이드바, 댓글 제외
  • 기사의 제목, 본문, 이미지, 출처 링크 제공
  • 텍스트 분석 및 요약 API와 결합 가능

📢 Article Extractor API를 활용하면 이런 것들이 가능!

  1. 뉴스 수집 + 요약: 뉴스 사이트에서 기사를 가져와 요약하는 데 유용
  2. 웹 콘텐츠 정리: 블로그, 포럼 글에서도 핵심 내용만 추출
  3. 텍스트 분석 전처리: 감정 분석, 키워드 추출을 위한 사전 작업

📌 Article Extractor API vs. 일반 뉴스 API 차이점

구분Article Extractor API뉴스 API (NewsAPI, Newscatcher 등)

기능 기사 본문 추출 뉴스 목록 제공 + 검색
출처 웹사이트 URL 기반 뉴스 사이트 제공 데이터
사용법 특정 기사 URL 입력 후 핵심 콘텐츠 추출 키워드 입력 후 관련 뉴스 검색

 

👉 결론:

  • 뉴스 검색이 목표NewsAPI, Newscatcher 사용
  • 기사의 본문이 필요Article Extractor API 사용
  • 요약까지 필요Article Extractor + SummarizeBot API 조합 추천

반응형