스퀴즈비츠는 AI 모델 성능을 유지하면서 32비트 데이터를 4비트 이하로 양자화한다. 더 빠르고 가벼운 AI 모델을 만드는 핵심 기술이다. 양자화된 모델을 기존 하드웨어에서도 효율적으로 연산할 수 있는 소프트웨어 엔진도 보유했다. 챗GPT를 시작으로 수많은 AI 기반 서비스가 출시되는 상황에서, AI 대중화의 가장 큰 걸림돌인 운영 비용을 절감할 것이라는 기대다.
스퀴즈비츠의 AI 경량화 기술은 모바일 스마트폰, 노트북을 비롯한 엣지 디바이스, GPU 클라우드 등 다양한 환경에 적용할 수 있다. 이미지, 비디오, 음성, 자연어 등 다양한 모델을 지원해 응용 분야도 넓다.
투자 유치를 기점으로 경량화 기술 경쟁력을 확보하고, 해외 시장 진출에 본격 나설 계획이다. 최근 경량화에 대해 익숙하지 않은 비전문가들도 손쉽게 AI 모델을 경량화하고 비교 및 분석할 수 있는 아울라이트(OwLite) 툴킷을 출시하기도 했다. 현재 엔비디아 GPU를 지원하고 있으며, 향후 인텔, AMD, ARM 등의 하드웨어, AI 반도체 스타트업들이 내놓는 NPU까지 다양한 하드웨어를 지원하도록 적용 범위를 확장할 예정이다.
스퀴즈비츠는 포스텍 대학원 딥러닝 가속기 하드웨어(Neural Processing Unit, NPU) 연구팀을 주축으로 구성됐다. 공동창업진은 지난 7년간 CVPR, NeurIPS, ICLR 등 머신러닝 분야 세계 최고 학회에서 경량화 관련 논문을 꾸준히 발표해 왔다. 현재까지 딥러닝 가속을 주제로 한 국제 논문만 70편 이상이다. AI 전용 하드웨어를 직접 설계한 경험도 있다. AI 알고리즘부터 하드웨어까지 전반에 걸친 최적화 기술을 구현하는 데 압도적인 기량을 갖춘 팀이라는 평이다.
김형준 스퀴즈비츠 대표는 “AI 기반 서비스가 고객 확보에서 수익 창출 단계로 넘어가기 위해서는 AI 운영 비용을 대폭 절감해야 하는 문제를 안고 있다”며 “스퀴즈비츠만의 AI 경량화 기술로 많은 기업이 안고 있는 비용과 효율 문제를 해결하고 AI 기술 잠재력을 극대화하는 데 기여하는 기업이 되겠다”고 말했다.
스퀴즈비츠는 2022년 3월 설립 이후 포스텍홀딩스와 네이버D2SF로부터 시드 투자를 유치했다. 기술력이 우수한 스타트업을 선정해 기술개발 자금을 지원하는 딥테크 팁스 프로그램에 선정되며 15억원 규모 기술 개발 자금을 확보했다.