原来的想法: 建立一个自己不熟悉词的词库,通过爬虫程序,搜索单词,查找含有词库单词的文章,文章以含有比如3个或3个以上(可自定)词库单词为选定标准,篇幅800词(自定)以内,范围限定在economist,newyorker等网站内,抓取之,生成一个doc文件什么的,加粗标出所查词(或者就是先在文章前把词列出,以提醒阅读时有所留意),再反馈未出现在抓取结果中的词(那些还是正常背吧.....)若是包含该词的ing ed 复数 adj adv n 等形式进行搜索就更好了....
当然,为了防止一些词重复出现另一些词少有出现,建立一套规则,比如:用于搜索的词库另为一份,每次查到有词的文章后就自动从词库中剔除该词,但是在加粗标出时仍然调取初始词库