图片是指由图形、图像等构成的平面媒体。图片的格式很多,但总体上可以分为点阵图和矢量图两大类,我们常用BMP、JPG等格式都是点阵图形,而SWF、CDR、AI等格式的图形属于矢量图形。有形式的事物,我们看到的,是图画、照片、拓片等的统称。图是技术制图中的基础术语,指用点、线、符号、文字和数字等描绘事物几何特征、形态、位置及大小的一种形式。随着数字采集技术和信号处理理论的发展,越来越多的图片以数字形式存储。
Office在2003版中增加了Document Imaging工具用它可以查看管理读取和识别图像文档和传真文本其实利用它的这个功能我们还可以把网页或电子书中的文字给抠出来
打开电子书尽量采用较大的字体(这里以《中国电脑教育报》2004年第37期A3版的拍照手机低端数码相机的终结者为例进行)翻到想要获取的页面用抓图软件SnagIt对相关的内容进行抓取然后在文件菜单中选择复制到剪贴板命令(也可以用其他抓图软件当然最简单的是Windows中自带的Print Screen键来抓取整个屏幕然后在画图程序中对不要的部分进行裁剪并保存然后复制)
在开始菜单的Microsoft Office工具中打开Microsoft Office Document Imaging在左侧窗口中单击鼠标右键选择粘贴页面把复制的图片粘贴到Document Imaging中在工具中选择使用OCR识别文本Document Imaging的OCR识别程序就会对图片进行识别完成后选择工具中的将文本发送到Word程序会自动打开Word文档展现在你面前的就是从图片中抠出来的文字如图所示