数字加工(digital processing),文学-出版学-数字出版-〔数字出版业〕,为深度挖掘内容资源的价值,实现内容资源的长期保存和广泛共享,按照一定技术标准,对内容资源进行数字化、规范化处理的过程。内容资源按存储形式,可分为非数字化内容资源和数字化内容资源。非数字化内容资源主要包括传统文献型内容资源、传统缩微和声像型内容资源,如传统书报刊、学术论文、电影胶片、录像带、照片等;数字化内容资源指以数字形式存储的内容资源,包括文本、图像、音频、视频和复合内容资源等。数字加工依据不同种类内容资源加工后的应用需求,采用不同的技术标准和格式体系。数字加工流程分为两部分:一是对非数字化内容资源的数字化处理,包括资源整理、内容扫描、图像处理、版面分析、OCR识别、内容校对等;二是对数字化内容资源的加工,包括资源整理、格式转换、结构化加工、元数据标引、内容的分类标引和主题标引等。根据数字加工后内容资源的应用需求,可将其分为长期保存级、复制加工级和发布服务级内容资源。