NuExtract3가 출시되었으며, 복잡한 문서에서 정보 추출을 돕는 오픈 모델이다.
NuExtract3는 복잡한 문서에서 정보 추출을 가능하게 하는 오픈 웨이트 4B 모델로, Apache-2.0 라이센스 하에 공개되었다. 다채로운 파일 형식인 PDF, 스크린샷, 표 및 인보이스로부터 데이터를 추출하는 데 유용하다. 사용자는 Hugging Face에서 무료로 이 모델을 사용해 볼 수 있다.
NuExtract3 has been released, an open model for extracting information from complex documents.
NuExtract3 is an open-weight 4B model aimed at practical information extraction from complex documents, released under the Apache-2.0 license. It supports various input types, including PDFs, screenshots, forms, tables, receipts, and invoices. Users can try it for free on Hugging Face, with guidance available for utilization.