大家好,我是在郑州工作的人,工作地点离咱们郑大不远。现在我手上有一份数据需要进行处理,想请懂计算机或编程的同学帮处理一下,不知道来对地方没有。
具体就是有一系列文件,例如:
http://patents.reedtech.com/downloads/ApplicationFullText/2016/ipa160908.zip
这是个600M左右的xml文件,里面是几百篇美国专利,是格式化的,包括了这些专利的各种信息,现在想把这几百篇专利的指定部分(申请人字段、日期字段、说明书字段)提取到excel或access里,方便进一步处理。
想请一位懂数据库或xml处理的同学帮助。如果能达到要求,报酬好说
这个xml里引用了dtd标准文件,在 http://www.uspto.gov/products/xml-resources.jsp里有
有能做的或者想进一步了解请联系微信 125488481 或电话 18638279831
我离郑大也比较近,可以加了再说