자연어 생성기반 뉴스 보도 패턴 일반화 및 뉴스 구성에 따른 분류 가능성 : 소규모 LSTM 생성 데이터를 통한 내용 및 표현 형식 기반 뉴스 유형화 원리 고찰
커뮤니케이션 이론 | 한국언론학회 | 40 pages| 2023.04.03| 파일형태 :
조회 1717 다운로드 0
자료요약
본 논문은 인공지능 자연어 생성 모델을 통해 보도된 기사들의 일반화된 보도 내용 데이터를 만들고, 이를 활용하여 이후 지도학습기반 뉴스 클러스터링 방식을 제안하는 연구이다. 보다 구체적으로는 뉴스를 수집하고 문장 기반 패턴 분석 방법을 활용하여, 이미 작성된 기사에서 쓰이는 단어와 주요 문장의 패턴이 추론된 자연어 생성기사 문장을 만들어낸다. 생성된 문장은 보도된 기사의 기본적인 보도 내용 및 관행을 보여주는 보도된 내용들의 일반화된 특질을 보여주는 것으로 본다. 그 다음 생성된 문장과 수집된 데이터 문장간의 내용 특질 유사성을 레벤슈타인 거리와 ROUGE 지표로 비교하여 컴퓨터가 만들어낸 문장과 실제 기사 문장 간의 내용과 표현상의 괴리를 측정함으로써, 보도된 뉴스를 빠르게 유형화하는 방법을 제안한다. 본 글에서는 이러한 방법이 적용되는 과정을 소규모 데이터로 감염병 백신 보도를 주제로 시연하고, 해당 방법이 가지는 의의와 향후 연구 가능성을 논의한다.
목차
1. 서론
2. 자연어 생성 기법을 통한 일반화된 뉴스 보도 패턴 발견 및 유형화
3. 자연어 생성 방식의 뉴스 유형화 데이터 구축 제안
4. 실제 데이터를 활용한 자연어 생성 결과
5. 토론
참고문헌
Abstract
#자연어 생성#레벤슈타인 거리#뉴스 유형화#Natural Language Generation#LSTM#Levenstein Distance#ROGUE#News Clustering
저작권 안내 및 사용범위와 규정
  • 위 정보 및 게시물 내용의 불법적 이용, 무단 전재, 배포는 법적으로 "금지되어" 있습니다.
  • 저작권 침해, 명예훼손 등 분쟁요소 발견시 하단의 “고객센터”를 이용해주세요.
  • 기타는 저작물의 등록자가 정하는 사용 범위와 규정에 준합니다.
  • 위 자료는 한국언론학회 가 저작권을 관리하고 있습니다.
자료 제공처