선배님들 지식을 얻고자 문의드립니다!
해외 본사에 PDF 파일을 매일 받는데, 몇 주 전부터 겉으로 보기에는 동일한 포멧인데,
PDF를 열고 내용을 드래그해서 복사/붙여넣기 하면 글자가 거의 대부분 깨지는 이상한 문자들이 포함되어 있습니다.
기존 정상 문자: 주식회사 서울특별시 주문번호 413405
현재 깨진 문자: 2345 2WX%
인터넷을 써치해서 PDF를 여러모로 분석해 보니, 실제 폰트는 PDF에서 만들것 같고, 보여주는 부분만 한글처럼(?) 보여지게 짜집기해서 화면이 구성된것 같아 보입니다.
위 내용을 보면 동일한 "주"의 경우 내부적으로 "2"를 이용하고 실제 화면에는 "주"를 표시하는것 같아 보입니다.
본사에 문의해도 "자신들은 시스템상에서 받았기 때문에 이상이 없다."는 답변을 받았습니다. ㅠㅠ
혹시 이런 증상을 보셨거나, 고칠 수 있는 방법이 있으면 알려주시면 너무너무 감사하겠습니다.
행복한 하루 되세요!
18개의 답변이 있습니다.
비슷한 사례가 있어 답변 드립니다.
저희는 간혹 리더 프로그램에서 비슷한 오류가 발생하더라구요
pro 버전에서는 폰트 깨지는 증상이 없었고, 최신 업데이트 유무도 체크하셔야 할것 같아요
댓글 남기기
답변을 작성 하시려면 로그인이 필요합니다.
로그인 회원가입인코딩 문제인것 같습니다.
댓글 남기기
답변을 작성 하시려면 로그인이 필요합니다.
로그인 회원가입pdf font에 유니코드 테이블이 없고 문자 문양 색인을 문자로 매핑하는데
표준 인코딩을 사용하지 않으면 가비지 문자가 표시될 수 있습니다.
그리고 pdf의 font가 시스템에서 사용하는 font에 없어도 그럴수 있구요.
이런 경우는 다른 pdf 프로그램은 모르겠지만
acrobat pro에서 preflight라는 기능으로 다시 pdf 파일 생성하면 됩니다.
acrobat pro 사용하시면 한번 해보세요~
아, 새로운 시각을 열어주시네요.
유니코드 테이블... 매핑... 표준 인코딩... 가비지 문자... preflight...
참고하여 찾아보겠습니다!
답변 감사합니다!!
댓글 남기기
답변을 작성 하시려면 로그인이 필요합니다.
로그인 회원가입인코딩 문제로 보입니다.
직접 해당 파일을 봐야 알것 같습니다.
해당 파일을 오픈하고 싶은데, 모두 대외비 자료라 제공이 어렵습니다. ㅠㅠ
답변 감사합니다!
댓글 남기기
답변을 작성 하시려면 로그인이 필요합니다.
로그인 회원가입제가 봐도 인코딩 문제 인 듯 한데....
PDF 리더를 다른 것을 한번 사용해보세요....
해당 국가에서 사용하는 제품으로 한번 사용해 보면 어떨까요?
리더를 정말 다양하게 바꾸어 보아도 동일한 증상이 나타나는걸 보면 다른 문제가 있는듯 싶습니다.
답변 감사합니다.
댓글 남기기
답변을 작성 하시려면 로그인이 필요합니다.
로그인 회원가입윈도에서 복사/붙여 넣기 기능은 윈도의 클립 보드를 이용해서 윈도 어플리케이션들간의 정보를 메모리 공유하는 기능의 일종이 되겠는데요.
오류가 발생하는 시점이 복사 시점인지, 붙여 넣기 시점인지를 우선적으로 확인해 볼 필요가 있어 보이네요.
클립보드를 열어두고서 복사한 후에 클립보드에 정상적인 내용이 들어오는지, 복사 시점에서 부터 원하지 않는 내용이 들어 오는지를 기준으로 판단해 볼 수 있겠고요.
복사 시점에서 해당 문제가 발생한다면 PDF 뷰어에서 복사하는 기능에 어떤 오류가 있거나 다른 작동을 하고 있다고 볼 수 있겠고...
클립보드에 정상적인 내용이 들어 왔는데, 붙여 넣기를 하면 해당 문제가 발생한다면 붙여 넣기 하는 프로그램 쪽에서 어떤 오류가 있거나 원하지 않는 작동을 하고 있다고 할 수 있겠고요.
아마도 PDF 뷰어 프로그램에서 오류가 있을 가능성이 높지 않을까 싶긴한데...
뷰어 프로그램에서 문제가 있다면 다른 뷰어 프로그램으로도 확인을 해 보는 게 좋을 것 같아 보이네요.
그리고,
PDF 문서는 겉으로 보이기에는 Text 문서인 것 처럼 보여도 이미지화된 문서일 수도 있고, 다른 암호화 등의 처리가 된 문서일 수도 있기 때문에 단순히 글자가 보인다해서 일반 텍스트 문서 처럼 모두 복붙 기능이 작동 할 것이라 생각해서도 안되겠고... PDF로 변환된 문서 포멧에 따라 처리 방법에 차이가 있을 수 있겠고요.
다양한 뷰어와 변환 프로그램을 이용해도 동일한 문자들이 나오고, 다른 PC에서도 동일한걸 보면 클립보드 관련 문제는 아닌듯 싶어요.
말씀처럼 이미지화 된 문서이면서, 그 이미지를 쪼각내서 폰트 형식으로 변환하지 않았나 하는 추측을 조심스럽게 해봅니다. ㅠ
답변 감사합니다!
댓글 남기기
답변을 작성 하시려면 로그인이 필요합니다.
로그인 회원가입저도 비슷한 사례가 있는데요.
특정 PDF 프로그램에서 비슷한 현상이 있어서
크롬 브라우저에서 pdf 파일을 오픈해서 해결했습니다.
크롬에서 pdf를 열면 폰트도 깨지지 않더라고요.
원인은 잘 모르겠지만, 인코딩 문제로 생각은 하고 있습니다.
아, 저는 크롬에서도 동일 하더라구요 ㅠ
답변 감사합니다!
댓글 남기기
답변을 작성 하시려면 로그인이 필요합니다.
로그인 회원가입PDF 파일에서 텍스트를 복사할 때 문자 인코딩 또는 글꼴 대체 문제를 다루고 있는 것 같습니다. PDF에 비표준 글꼴이 포함되어 있거나 텍스트가 시스템과 호환되지 않는 방식으로 인코딩된 경우 이런 일이 발생할 수 있습니다.
이런경우 때로는 기본 PDF 뷰어가 특정 글꼴이나 인코딩을 제대로 처리하지 못할 수도 있기 때문에 다른 PDF 뷰어나 편집기에서 PDF 파일을 열어보면 원인을 파악하는데 도움이 될 수 있습니다.
그리고, 일부 PDF 뷰어에서는 글꼴 대체 처리 방법을 지정할 수 있는데, PDF 뷰어의 설정을 확인하여 비정상적인 글꼴이 잘못된 문자로 대체되지 않도록 처리해주세요.
만약, 위 방법대로 확인했는데 해결이 안된다면 OCR 소프트웨어를 사용하여 PDF 에서 텍스트를 추출해 볼 수 있습니다. OCR 소프트웨어는 이미지이세 텍스트를 인식할 수 있으므로 텍스트가 잘못 표시되더라도 정확하게 추출할 수 있습니다.
PDF 뷰어를 다양하게 테스트 해도 동일하고, 변환 프로그램을 사용해도 동일한걸 보면, 말씀처럼, OCR도 생각해 봐야 할 것 같습니다. ㅠ
답변 감사합니다!
댓글 남기기
답변을 작성 하시려면 로그인이 필요합니다.
로그인 회원가입PDF 파일을 변환하면서 문제 생긴것 같습니다.
PDF 파일로 변환할때 어떤 프로그램을 쓰는지 확인해보고 그 사이트에 가보면 해결방법이 있을 것 같습니다.
다른 몇가지 PDF 프로그램들 보니 일부 텍스트 깨짐현상있을 때, 어떻게 하라는 안내글들이 보이는 걸로 봐서는 비슷한 증상일 것 같습니다.
네, 말씀처럼 PDF를 변환시 문제가 생긴것 같아요.
해외 본사에 어떤 프로그램 쓰는지 물어보기 어렵네요.
답변 감사합니다.
댓글 남기기
답변을 작성 하시려면 로그인이 필요합니다.
로그인 회원가입PDF 파일이 아닌 다른 (word , web) 폰트에서 짜집기를 한것 같은데요
원본파일 외에 다른 파일 폰트 문제로 보여집니다.
답변 감사합니다!
동일한 현상을 재현해야 해결 할 수 있을것 같은데, 어렵네요~! ㅠ
댓글 남기기
답변을 작성 하시려면 로그인이 필요합니다.
로그인 회원가입