[오웰 FAQ] 동일 보도자료 넣으면 같은 기사가 생성될까?

저널리즘 AI 오웰 가입을 검토하는 분들이 한결 같이 물어보는 질문이 있습니다.

"만약 동일한 보도자료로 여러 언론사가 오웰을 통해 기사를 작성한다고 하면, 모두 같은 내용의 기사가 생성되는 것은 아닌가요?"

충분히 우려할 만한 대목입니다. 결론부터 말씀드리면 동일한 보도자료를 바탕으로 기사를 작성한다고 해도 동일한 결과물이 나오지는 않습니다. 그 근거를 여기에서 설명을 드리도록 하겠습니다.

실험과 검증

여러 언론사들이 동일한 보도자료를 입력했다손 치더라도 동일한 기사로 나타나지 않는다는 걸 증명하기 위해 다음과 같이 실험을 해봤습니다.

  • 동일 보도자료(기사) 입력 - 1차 출력본 확인
  • 동일 시간 동일 보도자료 입력 - 2차 출력본 확인
  • 순차 시간 동일 보도자료 입력 - 재작성 버튼 - 3차 출력본 확인
  • 1일 경과 뒤 동일 보도자료 입력 - 4차 출력본 확인

먼저 동일 보도자료 원문을 제시해 보겠습니다. 조금은 극단적인 사례를 가정하기 위해 짧은 보도자료를 선정했습니다.

캐나다관광청은 이번 겨울이 11년 주기로 찾아오는 태양활동 극대기로, 더 강렬하고, 더 자주 오로라가 모습을 드러내 오로라 관측에 적합한 시기라고 12일 밝혔다.캐나다관광청은 미국항공우주국(NASA)이 선정한 세계 최고의 오로라 관측지인 옐로나이프를 소개했다.이곳은 1년 내내 오로라가 쉽게 형성되는 북위 60~70도 지역을 뜻하는 '오로라 오벌'(Aurora Oval) 바로 아래 자리 잡고 있다.이곳에서는 연중 약 240일 동안 오로라를 관찰할 수 있고, 3박 체류 시 평균적으로 95%, 4박 체류 시엔 98%의 확률로 오로라를 만날 수 있다. 캐나다관광청 관계자는 "동계 오로라 관찰의 최적기는 11월 하순부터 4월 초순까지"라며 "옐로나이프는 오로라 관측을 위한 전용 시설과 서비스가 구축돼 있어 야간 오로라 감상과 주간 겨울 액티비티를 함께 즐길 수 있다"고 말했다.


이 보도자료를 바탕으로 오웰을 거쳐 1차 출력본을 확인해 봤습니다. (조건 : GPT-4o, 권위있는 기사체, 이모지 없음, 밀레니얼, 평어체)

캐나다관광청은 올해 겨울이 11년 주기로 찾아오는 태양활동 극대기에 해당한다고 12일 밝혔다. 이에 따라 더욱 강렬하고 빈번하게 나타날 오로라가 관측에 이상적인 조건을 제공할 것으로 보인다.  특히 캐나다 북서부에 위치한 옐로나이프는 미국항공우주국(NASA)으로부터 세계 최고의 오로라 관측지 중 하나로 선정되었다. 이 지역은 북위 60~70도에 걸친 '오로라 오벌'(Aurora Oval) 바로 아래 자리 잡고 있어, 자연적으로 오로라 형성이 용이한 지리적 이점을 갖추고 있다.  옐로나이프에서는 연중 약 240일 동안 오로라를 목격할 수 있는 것으로 알려져 있다. 평균적으로 3박 체류 시 약 95%, 4박 체류 시에는 98%의 높은 확률로 화려한 빛의 향연을 경험할 수 있다.  캐나다관광청 관계자는 "동계 시즌인 11월 하순부터 다음 해 4월 초순까지가 옐로나이프에서 오로라를 감상하기 가장 좋은 시기"라고 전했다. 또한, 그는 "옐로나이프는 관광객들이 야간에는 환상적인 오로라를 감상하고 주간에는 다양한 겨울 액티비티를 즐길 수 있도록 전용 시설과 서비스를 완벽히 갖추고 있다"고 덧붙였다. 이번 겨울, 태양활동 극대기가 선사하는 장엄한 자연 현상을 목격하며 잊지 못할 추억을 만들 기회가 될 것으로 보인다. 추천 태그 : #캐나다여행 #오로라관측 #옐로나이프

 다음으로 동일한 시간에 다른 창에서 동일한 보도자료를 입력해 2차 출력본을 확인해 봤습니다. 옵션 설정을 위와 동일했습니다.

이번 겨울은 11년 주기로 찾아오는 태양활동 극대기에 해당하며, 이에 따라 더 강렬하고 빈번한 오로라를 관찰할 수 있는 특별한 시기가 될 전망이다. 캐나다관광청은 12일 이러한 사실을 밝히며, 미국항공우주국(NASA)이 선정한 세계 최고의 오로라 관측지인 옐로나이프를 추천했다. 옐로나이프는 '오로라 오벌'(Aurora Oval)이라 불리는 북위 60~70도 지역 바로 아래에 위치해 있어, 1년 내내 쉽게 오로라가 형성되는 이상적인 환경을 자랑한다. 이곳에서는 연중 약 240일 동안 오로라를 관찰할 수 있으며, 평균적으로 3박 체류 시에는 95%, 4박 체류 시에는 무려 98%의 확률로 환상적인 오로라를 만날 수 있다. 캐나다관광청 관계자는 "동계 시즌 중 특히 11월 하순부터 이듬해 4월 초순까지가 최고의 시기"라고 설명했다. 또한 그는 "옐로나이프는 오로라 관측에 특화된 시설과 서비스를 보유하고 있어 야간의 신비로운 자연현상을 감상하는 동시에 낮에는 다양한 겨울 액티비티를 즐길 수 있다"고 강조했다. 추천 태그: [오로라 관측지, 태양활동 극대기, 옐로나이프 여행]

 다음으로 1차 출력본이 있는 상태에서 '재작성' 버튼을 눌러 3차 출력본을 확인해 봤습니다. 물론 옵션 설정은 동일합니다.

올해 겨울은 11년 주기의 태양활동 극대기에 해당하며, 강렬하고 빈번한 오로라 현상이 전 세계적으로 관찰될 것으로 기대된다. 캐나다관광청은 이러한 시기를 맞아 NASA가 선정한 세계 최고의 오로라 관측지인 옐로나이프를 추천했다. 옐로나이프는 북위 60~70도의 '오로라 오벌'(Aurora Oval) 바로 아래에 위치해 연중 약 240일 동안 오로라를 목격할 수 있는 최적의 조건을 제공한다. 평균적으로 3박 체류 시 95%, 4박 체류 시에는 98% 이상의 확률로 화려한 오로라를 감상할 수 있다. 캐나다관광청 관계자는 "11월 말부터 이듬해 4월 초까지가 가장 적합한 관측 기간"이라고 밝히며, 이곳에서 야간에는 신비로운 자연현상을 경험하고 낮에는 다양한 겨울 액티비티를 즐길 수 있다고 설명했다. 또한, 옐로나이프는 오로라 감상을 위한 특화된 시설과 서비스를 갖추고 있어 관광객들에게 편리함과 즐거움을 동시에 제공한다고 전했다. 추천 태그: [오로라 여행, 태양활동 극대기, 옐로나이프]

이번에는 동일한 보도자료를 하루가 지난 뒤 다시 입력해서, 4차 출력본을 받아봤습니다.

캐나다관광청은 올해 겨울이 11년 주기로 찾아오는 태양활동 극대기에 해당한다고 12일 밝혔다. 이에 따라 더 강렬하고 자주 나타나는 오로라를 감상할 수 있는 적기라고 전했다. 특히 세계 최고의 오로라 관측지로 꼽히는 옐로나이프에 주목할 것을 권고했다.  미국항공우주국(NASA)이 선정한 옐로나이프는 북위 60~70도 지역의 '오로라 오벌'(Aurora Oval) 바로 아래 위치해 있다. 이곳은 연중 약 240일 동안 오로라가 형성될 만큼 관측 환경이 뛰어나다. 관광청에 따르면, 방문객들은 3박 체류 시 평균적으로 95%, 4박 체류 시에는 무려 98%의 확률로 오로라를 목격할 수 있다고 설명했다.  관광청 관계자는 "옐로나이프에서 동계 시즌인 11월 하순부터 다음 해 4월 초까지가 오로라를 감상하기에 가장 적합하다"고 전하며, "오로라 관측을 위한 전용 시설과 다양한 서비스가 마련돼 있어 야간에는 환상적인 자연 현상을 즐기고, 낮에는 겨울 액티비티를 체험할 수 있다"고 강조했다. 추천 태그 : #오로라여행 #태양활동극대기 #옐로나이프

각 회사별 리드문 비교

아래는 비교하기 쉽게 각 차수별로 첫 문장을 뽑아낸 것입니다. 아울러 전체 길이의 차이를 확인하기 위해 본문 길이도 함께 측정했습니다.

차수 리드문 본문 길이
원문 캐나다관광청은 이번 겨울이 11년 주기로 찾아오는 태양활동 극대기로, 더 강렬하고, 더 자주 오로라가 모습을 드러내 오로라 관측에 적합한 시기라고 12일 밝혔다. 435자
1차 캐나다관광청은 올해 겨울이 11년 주기로 찾아오는 태양활동 극대기에 해당한다고 12일 밝혔다. 이에 따라 더욱 강렬하고 빈번하게 나타날 오로라가 관측에 이상적인 조건을 제공할 것으로 보인다. 625자
2차 이번 겨울은 11년 주기로 찾아오는 태양활동 극대기에 해당하며, 이에 따라 더 강렬하고 빈번한 오로라를 관찰할 수 있는 특별한 시기가 될 전망이다. 511자
3차 올해 겨울은 11년 주기의 태양활동 극대기에 해당하며, 강렬하고 빈번한 오로라 현상이 전 세계적으로 관찰될 것으로 기대된다. 466자
4차 캐나다관광청은 올해 겨울이 11년 주기로 찾아오는 태양활동 극대기에 해당한다고 12일 밝혔다. 이에 따라 더 강렬하고 자주 나타나는 오로라를 감상할 수 있는 적기라고 전했다. 498자

동일한 보도자료로 4차례를 시도해본 결과 동일한 기사로 변경된 사례는 단 하나도 없었습니다. 물론 이러한 시도가 동시에 수백 건이 일어난다면 어떨지 장담하기 어렵지만 새로운 시도를 할 때마다 문장의 배치나 구조가 조금씩 달라진다는 것을 확인할 수 있을 겁니다.

무엇보다 고작 원고지 2매 정도에 불과한 아주 짧은 보도자료임에도 문서의 중복 현상이 나타나지 않는다는 점을 주목할 필요가 있습니다. 이는 보도자료 원문이 길어지면 길어질수록 훨씬 더 다양한 단어와 문장의 교체가 이뤄질 수 있다는 걸 의미합니다. 결과물의 중복 확률은 그만큼 떨어진다는 얘기입니다.

Temperature와 Top-k 파라미터 영향

위 사례처럼 짧은 보도자료를 여러 차례 입력했음에도 결과물이 차이가 났던 것은 언어모델의 파리미터값을 저희가 조정을 했기 때문입니다. 생성 또는 변경되는 문장의 창의성과 다양성을 조정하는 2가지 파라미터가 있습니다. 이는 저희 쪽에 각 문체별로 상이하게 설정해두는데요. 이 가운데서도 가장 큰 영향을 미치는 파라미터가 Temperature와 Top-K 값입니다.

예를 들어 Top-k 값은 '가나다'라는 단어 뒤에 나타날 단어군의 수를 지정하는 것입니다. k값이 높으면 다양한 단어들이 등장하고 배치될 확률이 높아지지만 '환각'의 위험도 커집니다. k값을 작게하면 정반대의 현상이 나타날 것이고요. 저희는 가장 적정한 값을 찾기 위해 여러 실험을 진행해왔습니다. Temperature 값도 마찬가지입니다. 값을 줄이면 단어의 보수적인 배치를 통해 중복성이 높아집니다. 바녀면 값을 높이면 다양한 단어 배열이 발생해 문장이 화려해지기도 합니다. 이 과정에서 또 환각의 위험을 감안해야 합니다.

비록 짧은 문장의 보도자료지만 다양한 문서의 길이, 리드문의 변형 등으로 결과물이 달라지는 이유는 바로 이 파리미터값을 적절하게 조정해오고 있기 때문입니다. 따라서 여러 언론사들이 동일한 보도자료나 문서를 사용한다고 해서 결과값이 동일하게 나타나지 않습니다.

이제 이러한 우려에서 벗어나 부담없이 저널리즘 AI 오웰을 사용해 보시기 바랍니다.

감사합니다.