문서 필터 솔루션

nuri Document Filter 는 다양한 문서 테스트를 거쳐 안정성과 기술력이 검증된 문서 텍스트 추출 SDK 솔루션입니다.
MS Office, 한컴오피스, Open Office, PDF, EML, MSG, 압축(10종) 등 대부분의 문서 포맷을 지원하며 문서 내 포함되어 있는 이미지 추출 기능까지 제공됩니다.

문의 02-2671-3344

문서 필터링 과정

문서 텍스트 추출 SDK 솔루션

주요 특징을 알아보겠습니다.

빠르고 안정적 성능 제공

  • 기존 상용 제품 대비 수 배 이상의 빠른 필터링 속도

  • 다년간의 연구·분석 경험을 통한 안정적인 성능 제공

  • 2GB 이상의 대용량 파일 필터링

  • Memory leak 제로화 및 예외처리로 안정성 제공

다양한 문서 포맷 식별 및 추출

  • 다양한 문서 포맷 유형에서 텍스트 추출

  • 문서 내에 포함되어 있는 이미지 데이터 추출

  • 암호화된 문서 파일 탐지

  • DRM 적용 파일에 대한 식별(10종)

  • 다수의(Alz, Egg 등 10종) 압축 파일 필터링 제공

다양한 OS 및 플랫폼 지원

  • Windows, Linux 32Bit/64Bit 지원

  • 모바일 환경(Android, iOS) 지원 가능

쉽고 편리한 인터페이스

  • C/C++, Java, Python, C# 등 다양한 인터페이스 제공

  • 사용자 환경에 적합한 라이브러리 및 실행 파일 제공

  • 메모리 및 파일 인터페이스 지원

운영환경

리눅스 서버
  • 운영체제
  • Ubuntu 16.04.3
  • CentOS 7.0
  • RHEL 7.0
  • 커널 2.6.18.xx 이상
  • GCC Lib 2.x ~ 4.x
  • CPU
  • Intel Xeon 4Core 이상
  • 메모리
  • 8GB 이상
  • 하드디스크
  • 1TB이상 여유공간
  • 인터페이스
  • C/C++, Java, Python, C# 등
윈도우 서버
  • 운영체제
  • Windows 2003 SP2 이상
  • CPU
  • Intel Xeon 4Core 이상
  • 메모리
  • 8GB 이상
  • 하드디스크
  • 500GB이상 여유공간
  • 인터페이스
  • C/C++, Java, Python, C# 등
윈도우 PC
  • 운영체제
  • Windows 7 이상
  • CPU
  • Intel Core i3 2.9GHz 이상
  • 메모리
  • 4GB 이상
  • 하드디스크
  • 10GB이상 여유공간

자주 묻는 질문과 답변

문서필터를 어디에 사용해야 하나요?

사내 개인정보 유출 방지, 검색, 메일 등 문서 내용 미리보기가 필요한 곳에 적용 가능합니다. 아래는 몇가지 예입니다.

웹/그룹웨어/E-mail 등의 첨부파일 미리보기
내 외부망 분리에 따른 문서유출 방지
문서 중앙화/개인정보보호 솔루션 연동

지원하는 파일 포맷에는 어떤 것들이 있나요?

문서편집기

  • MS Word(97, 2003, 2007, 2010, 2013, 2016)

  • OpenOffice Word Document(ODT)

  • Hancom HWP(2007,2010, 2014), 배포용 문서 포함

  • 이치타로

스프레드시트

  • MS Excel(97, 2003, 2007, 2010, 2013, 2016) - xlsb, xlsm 지원

  • OpenOffice Excel Document(ODS)

  • Hancom CELL(2007,2010, 2014)

Presentation (프레젠테이션)

  • MS PowerPoint(97, 2003, 2007, 2010, 2013,2016)

  • OpenOffice Powerpoint Document(ODP)

  • Hancom SHOW(2007,2010, 2014)

압축

  • Zip, Egg, Alz, gzip, Tar, 7z, gz, rar, tbz, jar

뷰어

  • Portable Document Format(PDF)

  • Electronic PUBlication Format(EPUB)

Text

  • Portable Document Format(PDF)

  • Electronic PUBlication Format(EPUB)

기타

  • Open Office ODF 파일 지원

  • Embedding된 OLE 개체 문서에 대한 필터링 기능 추가

  • HTML 문서의 태그 필터링 기능 추가

  • EML, RTF, MSG, MP3, MIME, CHM

  • 파일 포맷은 알 수 없지만 파일 내부의 문자열을 추출할 수 있는 형태의 파일들

이미지 추출 가능 포맷

  • HWP, DOC, DOCX, XLS, XLSX, PPT, PPTX, PDF

  • ODT, ODS, ODP, MP3