네비우스 AI 클라우드 인프라에 추론 가속 기술 공급, GPU 비용 최대 90% 절감
AI 추론 서비스 기업 프렌들리AI가 글로벌 AI 클라우드 인프라 기업 네비우스(Nebius)와 협력해 더 빠르고 효율적인 AI 서비스 제공을 돕는다고 밝혔다.
이번 협업에 따라 프렌들리AI의 최적화된 추론 기술이 네비우스의 대규모 AI 클라우드 인프라에 결합된다. 네비우스 인프라에서 고객 지원 챗봇, 코딩 어시스턴트, AI 에이전트 서비스 등을 운영하는 기업들은 이제 프렌들리AI의 API로 즉각 빠른 속도, 비용 효율, 안정성까지 개선된 추론 환경을 경험할 수 있다.
프렌들리AI와 손잡은 네비우스는 AI 산업에 필요한 풀스택 인프라를 제공하는 네오 클라우드 기업이다. 네덜란드 암스테르담에 본사를 두고 있으며 미국 나스닥(NASDAQ)에 상장돼 있다. 현재 유럽, 북미, 이스라엘 전역에 고성능 AI 워크로드용 인프라를 제공 중이다. 특히 최근 마이크로소프트와 194억 달러 규모의 AI 컴퓨팅 파트너십을 체결하며 글로벌 AI 인프라 시장의 핵심 공급자로 자리매김했다.
프렌들리AI는 독자 기술로 글로벌 최고 수준의 AI 추론 가속, 효율화 기술을 제공하는 기업이다. AI 개발과 서비스 운영 시 기업의 가장 큰 부담 요소인 GPU 비용을 최대 90%까지 절감할 수 있다. 모델 인프라 수준의 최적화, 연속적 배치 처리(Continuous Batching) 등의 독자 기술을 통해 2배 이상 빠른 추론 속도도 제공한다. 특히99.99%에 달하는 가동 시간(SLA) 보장도 강점으로 평가된다. 이는 AI 전용 하이퍼스케일 인프라의 안정적 운영이 점점 더 중요해지고 있는 최근 트렌드에서 대형 고객사들이 프렌들리AI를 고평가하는 대목이다.
이 밖에도 46만개 이상의 허깅페이스(Hugging Face) 모델을 지원하는 프렌들리AI의 추론 플랫폼은 프로토타입부터 대규모 운영 단계에 이르는 전주기에서 신속한 제품 출시와 간편한 배포를 지원한다.
전병곤 프렌들리AI 대표는 “우리의 목표는 세계적 수준의 AI 추론 기술을 모든 기업이 쉽게 이용할 수 있게 하는 것”이라며 “프렌들리AI의 추론 최적화 기술과 네비우스 AI 클라우드의 결합은 이제 모든 고객이 누구나 최고 수준의 지연 시간, 안정성, 비용 효율성을 겸비한 AI 모델을 배포할 수 있다는 의미”라고 말했다.
한편, 프렌들리AI는 이번 협력으로 올해 초부터 추진한 글로벌 확장 전략의 연속성을 확보하고 또 하나의 유의미한 마일스톤을 달성했다는 평가다. 회사는 앞서 지난 1월 세계 최대 규모의 AI 모델 플랫폼 허깅페이스에 한국 기업 최초로 AI 모델 배포 옵션을 공급하며 업계의 이목이 집중된 바 있다. 이어 5월에 실리콘밸리 엑시트 경험을 보유한 이상원 COO(최고운영책임자)를 영입하고 다수의 글로벌 AI 컨퍼런스에서 자사의 기술 우위를 널리 알렸다.
이에 국내외에서 다수의 대형 파트너십과 투자 유치도 이끌어냈다. 프렌들리AI는 현재 LG AI연구원의 최신 모델 엑사원 4.0의 공식 배포 파트너이자 정부 K-AI 모델 사업의 정예팀 참여 기업이다. 특히 지난 8월에는 실리콘밸리 유명 VC가 참여한 가운데 시드 라운드로 이례적인 2000만 달러 규모의 시드 익스텐션 투자를 유치, 글로벌 시장에서의 성장 잠재력을 다시 한번 인정받았다.
최용석 기자 duck8@donga.com
ⓒ dongA.com All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
인기 뉴스