북마크 입니당 >

PDF vs 이미지, 두가지 포맷 중 어느 것이 엑셀로 바꾸는데 좋을까?

pdf를 엑셀로 바꾸는 방법은 여러가지가 있다.

1. 파이썬 같은 프로그래밍 언어를 사용한다든지

2. 온라인 프로그램을 이용한다든지

3. 요즘 ai 지원하는 내장 프로그램들을 이용하든지(엑셀, pdf 등)


그런데 이 pdf도 pdf 나름이다.

아무리 ocr이라고 해도,

프로그램에서 pdf로 변환 한 것이 아닌,

기기나 사진을 이용한 스캔본은 위 프로그램도 인식을 어려워한다.


이는 ai도 마찬가지다.

우리 눈에는 이미지나 스캔본 pdf나 똑같은데, 기계는 인식자체를 달리한다.


Screenshot Img to TXT, tesseract 정확도 높이는 방법


그래서 나는 종이 스캔본은 당초에 이미지로 바꿔버린다.

온라인을 이용하려 해도 찝찝하고.

아직 내장 ai는 구축하지 않았다.


PDF는 압축과정을 거치며 레이아웃을 만들어 낸다.

그래서 이 장막을 벗겨내기 위해서,

일부러 이미지화라는 전처리 과정이 필요하다.


OCR 자체도 이미지화를 한 다음 인식한다.

하지만, 그래봤자 무료의 한계는 분명하다.


내가 별도로 이미지화하여 인식 대상을 단순화시키며,

해상도를 높인다.


AI는 pdf보다는 이미지 학습을 많이 해 왔다.

아무리 광고에서

한컴이 ai를 선두한다고 하고,

마소가 엑셀에 ai를 넣고 한다고 해도,

아직 많이 멀었다.


데이터의 순수성!

엑셀 저장포맷이 csv라면, 작업한 거 다 날라갑니다. | 영덕대게태양광

그게 가장 중요하다.


자체적으로 뭔가 찝찝한 것이 있다면 ai가 분석 후 지적도 해 준다.

요즘 참 일하기 편해졌다.

요즘 아직 vlookup을 사용하는 곳이 있을까?

이미지로 스크린샷 한 다음,

어떻게 데이터 정리 할까 ai에게 물어보면 되는데???

댓글

7일동안 많은 클릭!!!

경찰에게 걸리면 범칙금 6만원(+ 벌점 15점) , 무인카메라에게 걸리면 과태료 7만원(빨간불에는 무조건 일시정지!)

태양광 3kw에 역전력계전기(RPR, 32p 계전기) 설치를 자제하는 이유(비용 ㄴ)

산으로 가는 기능사 시험(신재생에너지발전설비 기능사)

대화형 AI 종류 및 추천

한전 계통 용량이 없을 때 대처방안(영덕대게 태양광 강좌)

태양광 독립형 인버터와 역전력계전기란 무엇인가?

산업단지 태양광 전 체크해야 할 사항(위법건축물편)