海南小黑 发表于 2012-7-10 15:09

有什么办法可以自动提取PDF文件里的Email地址

有什么办法可以自动提取PDF文件里的Email地址? 批量提取,,就是有很多个PDF文件,如何把文件里的email地址都提取出来?现成的软件或编程思路都行,先谢谢了~

kobecui 发表于 2012-7-10 15:22

不懂帮顶

wudi8848 发表于 2012-7-10 16:03

不懂的路过,最笨的办法就是如果没做限制,能直接转成TXT的话,这个好说,直接搜索@字符,然后前后识别一下;如果没法直接转TXT的话,只能一页一页做文字识别了

feenn 发表于 2012-7-10 17:38

如果有元数据,可以直接提。但是如果都是图片的话,只能OCR了

zdq201212 发表于 2012-7-11 21:00

页: [1]
查看完整版本: 有什么办法可以自动提取PDF文件里的Email地址