인공지능이 ‘말하는 존재’에서 ‘행동하는 존재’로 진화하다 인공지능은 오랫동안 언어를 이해하고 생성하는 영역에 머물러 있었습니다. 대규모 언어 모델(LLM, Large Language Model)의 발전은 문맥 이해, 번역, 요약, 대화 등에서 인간 수준의 성과를 보여주었지만, 그 모든 능력은 여전히 “예측(prediction)”의 한계를 벗어나지 못했습니다. 즉, LLM은 데이터를 기반으로 가장 가능성이 높은 단어를 생성할 뿐, 실제 계산이나 검증을 수행하지 못했습니다. 그러나 […] || 인공지능이 ‘말하는 존재’에서 ‘행동하는 존재’로 진화하다
인공지능은 오랫동안 언어를 이해하고 생성하는 영역에 머물러 있었습니다. 대규모 언어 모델(LLM, Large Language Model)의 발전은 문맥 이해, 번역, 요약, 대화 등에서 인간 수준의 성과를 보여주었지만, 그 모든 능력은 여전히 “예측(prediction)”의 한계를 벗어나지 못했습니다. 즉, LLM은 데이터를 기반으로 가장 가능성이 높은 단어를 생성할 뿐, 실제 계산이나 검증을 수행하지 못했습니다.
그러나 엔터프라이즈 환경에서 진정한 AI의 가치는 단순한 언어 예측이 아니라 행동(action) 에서 비롯됩니다. 기업이 기대하는 AI는 데이터를 직접 분석하고, 코드를 실행하며, 실시간 정보를 활용해 스스로 판단하고 검증할 수 있어야 합니다. 이러한 패러다임의 전환은 바로 Agentic AI, 즉 “스스로 사고하고 실행하는 지능형 에이전트”의 시대를 여는 핵심 개념입니다.
Amazon은 이러한 변화의 중심에서 Bedrock AgentCore를 통해 완전한 Enterprise Agentic AI 플랫폼을 구현했습니다. AgentCore는 모델 추론, 메모리 관리, 보안 정책, 그리고 도구 실행 환경을 하나로 통합한 엔터프라이즈급 AI 인프라이며, 그 핵심에는 Built-in Tools인 Code Interpreter와 Browser Tool이 있습니다. 이 두 도구는 LLM이 단순한 언어 생성기를 넘어, 실제로 코드를 실행하고 웹을 탐색하며, 검증 가능한 결과를 산출하는 능동적 에이전트로 발전하도록 설계되었습니다.
지금까지의 LLM은 학습 시점에 고정된 데이터에 의존하기 때문에, 최신 정보를 반영하거나 실제 데이터를 분석·검증하는 데 한계가 있었습니다. 기업은 이를 보완하기 위해 외부 API를 직접 연결하거나 별도의 Python 환경을 운영해왔지만, 이 방식은 복잡하고 보안 및 일관성 유지가 어렵다는 문제가 있었습니다. Bedrock AgentCore는 이 문제를 근본적으로 해결합니다. Code Interpreter는 모델이 직접 코드를 실행하여 데이터를 계산·분석하고, 그 결과를 바탕으로 신뢰도 높은 인사이트를 제공합니다. Browser Tool은 실시간으로 웹을 탐색하여 최신 정보를 확보함으로써, 빠르게 변화하는 외부 환경에 대응할 수 있도록 합니다.
이처럼 Amazon Bedrock AgentCore의 Built-in Tools은 Agentic AI가 요구하는 “지능적 행동력”을 구현함으로써, AI가 언어를 넘어 현실 세계와 상호작용하며 스스로 검증하는 엔터프라이즈급 지능체계로 진화하도록 돕습니다. 이를 통해 고객은 정확하고 신뢰할 수 있는 AI 기반 의사결정 환경을 구축하고, 데이터 분석과 업무 자동화를 한 단계 높일 수 있으며, 더 나아가 AI가 실제로 행동하는 기업형 Agentic Intelligence를 실현할 수 있습니다.
LLM의 본질적 한계: 추론은 언어가 아니다
언어 모델의 추론 능력은 통계적 예측의 산물입니다. 하지만 현실의 문제는 단순히 말로 해결되지 않습니다. 예를 들어 “2023년 이후 매출 성장률을 기반으로 2026년 순이익을 예측하라”는 질문을 받았을 때, LLM은 문맥적으로 그럴듯한 답을 생성할 수 있지만, 실제 계산을 수행하거나 그 결과가 실제 데이터와 일치하는지 스스로 확인할 수 없습니다.
이 한계를 학문적으로 분석한 연구들이 있습니다. ‘Boye & Moëll(2025)’의 논문 “Large La