SharedIT | 묻고 답하기(AMP)

파일데이터 DB화 문의

안녕하세요


DOC또는 PDF파일로 존재하는 내용을 DB화 하려고 합니다.

이전데이터의 활용이 주목적이구요

우선 사람이 넣는 방법이 있을것 같은데..  이것이 수량이 몇만개 되다보니 엄두가 안나네요.. ㅠㅠ


비슷한 작업을 해보신 경험이 있으시거나 좋은 솔루션이나 방법, 업체를 아시는분은

조언부탁드립니다.


감사합니다.

Tags : 태그가 없습니다.

7개의 답변이 있습니다.

rlab
  0 추천 | 약 4년 전 | 알랩 | 010-3018-1699

클라우드  기반의  검색 및 문서관리 시스템이 가능할 것 같습니다.

문서를 추가하면  자동으로 OCR을 거쳐 검색시스템에 등록됩니다.

오리지널 문서는 문서관리 시스템에 등록되어 다운로드 가능합니다.

필수ㅈ적인 기능만 구현한다고 하면, 구축 비용은 대략 1000만원 정도로 예상해 봅니다.

문의 주시면, 보다 상세히 설명해 드립니다.


abilists.com
  0 추천 | 약 4년 전

@wansoo님이 말씀하신것 처럼 두가지 방법 있습니다.

그리고, 자동으로 하실려고 하려면 개발자가 필요합니다.


Abilists.com에도 프로젝트 메뉴에 파일 관리가 들어 있습니다.
저도 어느쪽을 선택해서 개발 할 까 고민했는데, 각기 장단점이 있습니다.


아래는 제가 알고 있는 장단점 입니다.

1, 파일 자체를 DB에 넣기

  장점

      - 파일(데이터 관리) 관리가 편합니다. (백업, 등 DB 파일만 관리하면 됨)

      - 특히 작은 사이즈 파일 관리가 편함

    단점

      - DB에 100% 의존하게 됩니다.

      - 어플리케이션에 커플링이 됨 ( 어풀리케이션 없으면, 다운로드가 힘듬)

      - 용량이 큰 파일을 관리하기가 거의 불가능

2, 파일을 따로 보관하고, 파일명과 패스를 DB에서 관리

    장점

      - DB용량이 작아도 됨

      - 큰 용량의 파일도 관리된 ( 몇 기가되 됨)

    단점

        - 파일과 DB를 같이 봐야 함(카피, 백업등등)


제가 개발한 Abilists는 플러그인 시스템이 있어, 원하시는 기능을 Abilists시스템(무료) 위해 자체 제작 할 수 있습니다.

Genghis Khan
  0 추천 | 약 4년 전

http://www.kaits.or.kr/business/protectOutflow.do

중소기업 30인미만 무료입니다.

관련 솔루션을 신청 후 사용하시면 문서 보안이 있습니다.

각 사용자의 오피스 파일 및 PDF  파일이 저장되고

해당 부분을 필터링이 되니  활용할수 있을듯 합니다.

씨크릿
  0 추천 | 약 4년 전

저도 ECM솔루션 도입을 권장드립니다. 파일이름 뿐아니라 내용상의 키워드 검색까지 하실려면...

벨아이앤에스
  0 추천 | 약 4년 전 | 벨아이앤에스 | 010-4354-1135

파일을 DB에 넣는 작업이 뭘 위한 건가요?
해당 니즈는 예전부터 회사내의 문서 및 컨텐츠를 라이브러리화 하여 관리하기 위한 ECM(EDMS)솔루션의 같은 이슈로 생각 됩니다.
ECM솔루션은 문서 및 컨텐츠를 DB화 하여 관리 할 수 있게 해주며 색인을 통해 문서의 내용까지 검색이 가능하게 해 줍니다.
지식관리시스템, 전자문서관리시스템, 전자컨텐츠관리 시스템 등 여러명으로 구축 됩니다.
궁금한 사항 있으시면 쪽지 주시기 바랍니다.

양성환
  0 추천 | 약 4년 전

파일 스트림 할 수 있는 데이터 베이스와, 개발자가 필요합니다...

wansoo
  0 추천 | 약 4년 전

바이러리 File을 DB화 하는 방법을 검토하고 계신 것 같은데요...

두가지 방법이 있을 것 같은데요.

한가지는 File은 NAS 같은 공유가능한 공간에다 두고, file에 대한 접근 경로만을 DB로 관리하는 방법과, 다른 하나는 Oracle의 BLOB type의 field에 바이너리 file 자체를 이진값으로 그대로 읽어 들여 집어 넣고 file명과 확장자도  함께 데이터 베이스화 해서 관리하는 방법이 있을 수 있겠고요.

이미 만들어 진 file들에 대한 DB 작업이라면 프로그램을 만들어서 처리하는게 맞지 않을까 싶겠고요.

file들이 있는 경로들을 탐색하면서 file 하나 하나에 대해 정보를읽어서 DB에 넣는 작업을 모든 경로 탐색이 끝날때까지 하도록 하면될 거 같아 보이네요.