雙層PDF格式文件是一種具有多層結構的PDF格式文件,是PDF文件衍生的一種文件,其特點(diǎn)是:文件既可以是文本型的(比如由word生成的文件),也可以是圖像型的,既可以100%保留原始版面效果,又便于建立索引數據庫,進(jìn)行科學(xué)的管理。
很多時(shí)候我們發(fā)現,明明PDF文件是掃描版的,卻可以復制其中的文字(偶爾會(huì )有錯字),這是怎么回事呢?原來(lái)這是PDF制作的一種技術(shù),叫“雙層PDF”。
雙層PDF格式文件是一種具有多層結構的PDF格式文件,是PDF文件衍生的一種文件,文件既可以是文本型的(比如由word生成的文件),也可以是圖像型的(比如由掃描生成的文件,包含圖像層),且其位置上下一一對應。制作過(guò)程中,資料通過(guò)掃描儀快速錄入后,經(jīng)過(guò)去污、糾偏和OCR識別,上層是原始圖像,下層是識別結果,然后可以直接生成可以檢索的PDF文件。這樣既可以100%保留原始版面效果,又便于建立索引數據庫,進(jìn)行科學(xué)的管理。