경상북도, 민원 응답 특화한 한국어 기반 인공지능 언어 모델(LLM) 개발

사진=센머니 제작
사진=센머니 제작

[센머니=현요셉 기자] 인공지능 분야는 지난 몇 년간 빠른 발전을 이루며 다양한 산업 분야에 혁신을 가져왔다. 그 중에서도 자연어 처리(NLP: Natural Language Processing) 분야는 거대 언어 모델(LLM: Large Language Model)의 출현으로 또 다른 도약을 기대하고 있다.

거대 언어 모델은 이름에서 알 수 있듯, 그 규모가 엄청나게 큰 언어 모델을 의미한다. 수십기가바이트 이상의 대용량 텍스트 데이터로 학습하여 언어의 세세한 패턴, 문법, 문맥적 의미까지 파악하는 능력을 지닌 이 모델은 자연어를 마치 인간처럼 이해하고 생성하는 능력을 가지고 있다.

LLM의 핵심적인 장점 중 하나는 다목적 활용이 가능하다는 점이다. 일단 충분한 데이터로 잘 학습되면 문장 생성, 기계 번역, 요약, 질의응답, 감정 분석 등 다양한 NLP 작업에서 활용될 수 있다. 또한, LLM은 전이 학습을 통해 사전에 학습한 지식을 다른 특정 작업에 쉽게 적용할 수 있어, 효율적인 학습과 높은 성능을 동시에 실현한다.

특히, LLM의 자연어 생성 능력은 혁신적이다. 사용자의 질문이나 입력에 대해 적절한 문장을 생성하여 다양한 애플리케이션에서 활용되고 있다. 대표적으로 챗봇, 텍스트 생성 도구, 작문 보조 도구 등에서 LLM의 힘을 볼 수 있다.

OpenAI의 GPT (Generative Pre-trained Transformer) 시리즈는 이런 거대 언어 모델의 대표적인 예시로 꼽힌다. 이 모델은 훈련 데이터의 다양성과 규모를 바탕으로 광범위한 주제와 문맥에 대해 응답할 수 있게 설계되었다.

 

사진=나라지식정보-경북연구원 협약식
사진=나라지식정보-경북연구원 협약식

나라지식정보, 경상북도 언어 모델 ‘기름(GI-LLM)’ 개발 협약 체결

지난 17일 나라지식정보(대표 손영호)는 경상북도와 함께 지역 특화 인공지능 언어 모델인 ‘기름(GI-LLM)’의 개발과 공급에 대한 협약을 체결하였다고 발표하였다. 이번 협약의 주요 내용은, 나라지식정보가 민원 응답에 특화하여 개발한 언어 모델 ‘나름(NA-LLM)’의 기술을 기반으로 경상북도만의 언어 모델을 공급하게 된다.

협약 체결식에는 경북연구원장 유철균, 나라지식정보 대표 손영호 등을 비롯한 20여 명의 개발 관련 인력과 유관 부서 담당자들이 참석하였다. 행사에서는 개발 내용의 구체적 소개와 연구원이 진행할 경상북도 특화 인공지능 개발 주제에 대한 발표가 있었다.

나라지식정보의 ‘나름(NA-LLM)’은 한국어 텍스트를 바탕으로 민원에 대한 자동 응답을 생성하는 인공지능 모델로, 외부 시스템으로의 정보 유출 위험 없이 안전하게 작동될 수 있도록 설계되었다. 또한, 경제적으로 효율적인 운영을 위해 모델 경량화 기법이 적용되어 일반 GPU 장비에서도 구동이 가능하다.

나라지식정보는 2만건 이상의 민원 관련 데이터를 활용하여 나름(NA-LLM)을 훈련시켰으며, 이를 바탕으로 경상북도 지역 이슈에 특화된 인공지능 언어 모델, 기름(GI-LLM)을 개발할 예정이다. 이 새로운 모델은 공무원들이 더 효과적으로 공공 업무에 집중할 수 있도록 도움을 줄 것으로 기대된다.

 

사진=센머니 제작
사진=센머니 제작

거대 언어 모델(LLM), 고객센터와 민원 응답의 미래인가?

인공지능(AI) 시대가 본격화되면서 '거대 언어 모델'이 고객 서비스와 민원 응답 영역에서 주목을 받고 있다. 이 모델은 다양한 장점을 제공하지만, 그만큼의 한계와 도전도 존재한다. 이에, 우리는 거대 언어 모델의 특징 및 기술적 한계를 살펴보고자 한다.

장점으로는 무엇보다 24시간 연중무휴로 일정한 품질의 서비스를 제공할 수 있다는 점이다. 인건비 절감, 다양한 질의에 빠른 응답, 일관된 서비스 제공은 고객 만족도를 높일 수 있는 주요 요인이다. 또한, 시간이 지나면서 데이터와 알고리즘의 발전으로 성능 향상의 가능성도 열려 있다.

하지만 단점도 무시할 수 없다. 복잡하거나 특별한 문제에 대한 응답 한계, 인간의 감각과 공감 능력 부재 등이 그것이다. 특히, 최신 정보나 학습 데이터에 포함되지 않은 정보에 대한 대응이 어렵다는 점은 서비스 제공에 있어서 주의가 필요하다.

기술적으로 볼 때, 거대 언어 모델은 문맥의 깊이와 창의성에서 한계를 보인다. 긴 대화에서의 문맥 유지가 어려우며, 완전히 새로운 문제나 상황에 대한 창의적 해결책 제시는 여전히 어렵다. 그리고 학습 데이터의 편향이 모델 응답에 반영될 위험이 있어, 민감한 주제에서는 부적절한 응답의 위험성도 배제할 수 없다.

거대 언어 모델의 출현은 인공지능이 인간의 언어를 더욱 깊게 이해하고, 다양한 분야에서 보다 효과적으로 활용될 수 있는 기술적 기반이 될 것으로 보인다. 하지만 그 한계와 도전을 정확히 이해하고 적절한 대응 전략을 마련해야 할 것이다. 기술의 발전과 함께, 적절한 활용 방안을 찾아나가는 것이 중요하다. 앞으로 이러한 기술의 발전과 적용 분야가 어떻게 확장될지 지켜보는 것이 흥미롭다.

저작권자 © 센머니 (SEN Money) 무단전재 및 재배포 금지