[AI 비즈니스] MIT보고서, “기업은 오픈 소스 생성 AI 위험, 이점을 고려해야 할 것”

생성 AI를 실험하라는 압력이 높아지면서 조직들은 도메인별 정확성과 같은 실제적인 문제부터 보안 및 개인 정보 보호 위험에 이르기까지 다양한 도전에 직면하고 있다.

엠테크 MIIT(EmTech MIT)에서 전문가들은 오픈 소스 생성 AI 모델의 장단점을 포함해 기업에서 생성 AI를 채택하는 문제와 이점을 탐구했다.

이달 초 MIT 테크놀로지 리뷰가 주최한 컨퍼런스 엠테크 MIT에서 IBM의 힐러리 헌터 대표는 ‘생성적 인공지능 세계에서의 데이터 영향’ 강연에서 초기 사용 사례에는 공급망, 고객 지원, 계약 및 법률이 포함된다고 언급했다.

그는 "기업들은 인공지능이 다양한 방식으로 그들을 공격할 것이라는 것을 이해하기 시작했다"고 말했다.

조직들이 생성 인공지능에 대한 광범위한 사용 사례를 탐구함에 따라 오픈 소스 옵션에 대한 관심이 증가했다.

GPT-4와 같은 인기 있는 대형 언어 모델에 대한 독점적인 라이센스 액세스는 장기적으로 제한적이고 비용이 많이 들 수 있지만 오픈 소스 대안은 종종 더 저렴하고 사용자 정의가 가능하다.

따라서 오픈 소스 옵션을 활용하면 기업은 공급업체에 대한 의존도를 줄이고 특정 작업 및 워크플로우에 맞춘 전문 내부 도구를 구축할 수 있다. 그러나 오픈 소스 생성 AI를 기업에 책임감 있게 통합하려면 보안, 윤리 및 기술 역량에 대한 위험을 엄격하게 평가해야 한다.

△오픈 소스 대 독자적인 생성 AI 평가

부즈 알렌 해밀턴(Booz Allen Hamilton)의 생성 AI 책임자인 앨리슨 스미스는 ‘오픈 소스 생성 AI’라는 프레젠테이션에서 오픈 소스 생성 AI의 기회와 위험에 대해 설명했다.

스미스는 텐서플로우 및 파이토치(PyTorch)와 같은 오픈 소스 이니셔티브와 관련된 주요 기계 학습 발전과 함께 오픈 소스 커뮤니티와 AI 혁신 사이의 역사적 연결을 강조했다. 그러나 생성 AI 시대에는 현재까지 가장 성능이 뛰어난 대규모 언어 모델이 폐쇄됐다.

그러나 생성 AI는 빠르게 진행되는 분야이며 특히 틈새 애플리케이션의 경우 미래에 균형이 바뀔 수 있다. 오픈 소스의 저렴한 비용, 유연성 및 투명성은 틈새 애플리케이션을 위한 모델을 미세 조정하고 보안 취약성에 대한 소스 코드를 조사하려는 조직에게 매력적이다.

스미스는 테크 타겟 편집과의 인터뷰에서 "오픈 소스와 폐쇄적이고 독점적인 것에 대한 논쟁은 항상 있어 왔다"고 말했다.

또한 그녀는 "그리고 저는 이러한 생성 AI 모델의 힘 때문에 그것이 증폭되었을 뿐이라고 생각한다"고 덧붙였다.

챗GPT와 같은 소비자 지향적인 생성 모델은 여전히 대부분 독자적이다. 하지만 스미스는 전문화, 투명성 및 비용 이점을 제공할 수 있는 더 좁은 응용 분야에서 오픈 소스가 매력을 얻고 있다고 생각한다.

그녀는 "모든 것에 대해 오픈 소스를 중심으로 이러한 포괄적인 진술을 하는 것은 정말로 어렵다"고 전했다.

대신, 독점 대 오픈 소스 생성 AI를 사용할지 여부를 결정하는 것은 특정 사용 사례의 세부 사항을 조사하는 것을 포함할 가능성이 높다.

스미스는 챗GPT와 같은 소비자 애플리케이션이 대부분 독점적인 상태로 남아 있는 반면, 특정 작업에 맞춘 더 작은 오픈 소스 모델의 생태계가 출현할 가능성을 언급했다.

그녀는 "저는 우리가 이렇게 광범위하고 포괄적인 인공지능 수준에서 이것과 저것을 보기를 기대한다고 생각하지 않는다"고 주장했다.

또한 그녀는 "챗GPT는 당신이 원하는 것을 무엇이든 물어볼 수 있고 모든 종류의 거친 작업을 할 수 있기 때문에 매우 좋다. 그러나 특정한 기업 수준의 사용 사례를 위해 그것이 정말 필요하냐 묻는다면 아마도 그렇지 않을 것"이라고 덧붙였다.

△오픈소스 생성 AI 개발의 어려움

장점에도 불구하고 전문가들은 오픈 소스 생성 AI를 구축하는 것은 어려울 것으로 보고 있다. 다른 유형의 소프트웨어 및 심지어 기계 학습의 다른 영역과 비교해 생성 AI는 모델을 만들고 운영하는 전문 인재뿐만 아니라 훨씬 더 광범위한 인프라 및 데이터 자원을 필요로 한다.

이러한 요소들은 모두 효과적인 오픈 소스 생성 AI를 구축하는 데 잠재적인 장애물이 있다.

오픈 소스 맥락에서 일하는 모델 개발자는 물론, 자금이 풍부한 기업에서도 유용한 고성능 모델을 훈련하는 데 필요한 재무 및 계산 자원을 획득하는 것이 어려울 수 있다.

이러한 자금 문제는 AI 개발에서 증가했지만 오픈 소스의 오래되고 광범위한 문제를 반영한다.

스미스는 "오픈 소스 소프트웨어를 사용하더라도 프레임워크나 라이브러리가 아무리 인기가 많더라도, 심지어 프로그래밍 언어로서의 파이썬조차도 이를 유지하는 모든 사람들에게 정말로 감사할 만한 일이 아니다"라고 말했다.

또한 그녀는 "그리고 상용화하기가 어렵다"며 문제를 제기했다.

스미스는 보안이나 컨설팅과 같은 특정한 특징이나 서비스에 비용을 청구하면서 기본적인 기능에 대한 무료 접근을 제공하는 프리미엄 모델을 잠재적인 자금 지원 접근 방식 중 하나로 언급했다.

다른 일반적인 모델로는 크라우드 펀딩, 비영리 단체의 지원, 빅 테크 회사의 자금 지원이 있다. 그러나 후자는 오픈 소스 모델과 소프트웨어 개발에 대한 영향력과 관련하여 까다로운 문제를 제기할 수 있다.

스미스는 "오픈 소스 커뮤니티의 가장 큰 장점은 기부금이 거대하고 다양한 사람들의 풀에서 나온다는 것"이라며 "그리고 여러분이 자금을 집중할 때마다, 여러분은 아마도 그 집중된 자금원의 인센티브를 과도하게 대표하게 될 것"이라고 주장했다.

AI 위험 예측.@news1 — **△기업에서 발생하는 AI 위험 예측 및 관리**

특히 도메인 및 조직별 데이터를 미세 조정해 기술을 최대한 활용하는 상황에서 생성 AI를 기업에 효과적으로 배치하려면 위험 관리와 혁신의 균형을 신중하게 유지해야 한다.

비록 많은 조직들이 생성적인 인공지능 계획을 빠르게 실행해야 한다는 압박감을 느낀다. 특히 민감한 애플리케이션의 경우 강력한 확률론적 모델을 배치하려면 사전 생각이 필요하다.

예를 들어, 의료 또는 국가 안보와 관련된 정보를 다루는 모델은 고객 서비스 챗봇보다 더 큰 위험을 수반한다.

내부 질문 응답 시스템과 같은 생성 인공지능의 엔터프라이즈 응용 프로그램의 경우 사용자 액세스 및 권한에 대한 제어의 필요성을 강조했다.

직원이 조직의 문서 관리 시스템 내의 특정 폴더에만 액세스할 수 있는 것처럼 내부 대규모 언어 모델은 정보를 수신할 수 있는 권한이 있는 사용자에게만 정보를 제공해야 한다. 적절한 액세스 제어를 구현하면 사용자가 자신의 역할에 적합한 응답만 얻을 수 있다.

스미스는 "가능한 위험을 열거하는 것부터 시작하는 것이 항상 중요하다"며 "(첫 번째는) 그것이 얼마나 심각한지, 어떤 행동을 취하려고 하는지, 그리고 두 번째는 얼마나 광범위한지, 즉 얼마나 많은 사람들이 영향을 받을지부터 시작해야 한다"고 경고했다.

모든 위험을 예측하는 것이 가능하지 않다는 점을 고려하면, 사고 대응 정책을 신중하게 계획하고 개발하는 것이 매우 중요하다. 스미스는 "저에게 가장 좋은 방법은 실제로 먼저 보안 태세부터 시작하는 것"라고 말한 다음, 효율성과 사용자 경험의 문제로 넘어갔다.

헌터는 IBM의 연구가 미리 계획을 세우는 것이 사이버 보안 사고와 관련된 비용을 상당히 줄일 수 있다는 것을 발견했다고 언급했다. IBM의 연례 보고서의 올해 판에서 사고 대응 계획과 테스트 수준이 높은 조직은 낮은 조직에 비해 거의 150만 달러를 절약했다.

스미스는 "저는 우리가 특히 신기술에 대해 흥분할 때 그 이점에 매우 열광하는 경향이 있다고 생각한다"고 말했다.

또한 그녀는 "저는 우리가 먼저 위험에 대해 이야기하고, 당신이 자세히 설명하고, 그것보다 훨씬 더 많은 것들이 있다는 것을 알고 있다"고 덧붙였다.

상단영역

본문영역

[AI 비즈니스] MIT보고서, “기업은 오픈 소스 생성 AI 위험, 이점을 고려해야 할 것”

관련기사

개의 댓글

댓글 정렬

내 댓글 모음