熟悉经济学人的朋友们可能会发现,在阅读经济学人时有一些词汇出现的频率会特别高,比如说要表达“下降,减少”的意思时,文章中不是用”decrease”,而是经常用”plummet,shrink,plunge,slump“,表达“上升,提高”时则喜欢用”skyrocket ,leapfrog“,当说明某事物前景美好时并不是用”promising”,而是用”rosy, sanguine,cheerful“这些词,对于在考试中被用滥了的”famous”,则有”celebrated,prominent,renowned,prestigious“这些词来代替。
此外,有部分我们常说的“生词难词”也在经济学人中频频亮相,比如”bonanza,plethora,nascent,raucous,schadenfreude“等,这些就是我们常常说的“高频词”。我刚开始阅读经济学人时常常碰到这些词,后来是通过一个一个生词查词典整理记忆后才逐渐解决了这个问题的。
我最近产生了一个想法:能不能把经济学人中的这些高频词都统计整理出来做成一份高频词汇表?对于初学者来说,如果能够先掌握这些高频词汇,在阅读经济学人时就会轻松很多,而不用像我当时那样一个一个去查词典。
我想了想,发现这是可行的。统计高频词的思路并不复杂:只要找到足够数量的经济学人文章(假设是5000篇),然后对这5000篇文章中的所有单词出现的次数进行统计,将统计的单词按照词频高低顺序列出来,再排除掉最常见的几千个单词(比如”the,a,on,of,house ,water”这类词)以及出现次数极少的单词,剩下的就是我们要找的高频词了。我手头有从2013到2015的两年多一共90多期经济学人,样本数量足够代表杂志的总体用词分布了(经济学人的文章虽然没有署名,但其作者数量并不多,且每个人的写作风格,用词风格也比较固定,因此这也为统计高频词提供了可能)。
接下来是实际操作环节,我把这90多期杂志上的文章全部汇总起来做成一个txt文档,统计了一下单词数,嗯,单词总数超过了550万。接下来需要对这550万个单词进行统计。对于统计的方法,可以自己写代码或者使用现成的统计软件。
我写了一段代码,放到新浪的云服务器上跑了一下,得到了最终的统计结果
550多万词的文本中不重复的单词数一共有12万6千个。接下来我们要对这12万单词进行筛选,先去掉最简单的一批单词(右边数字表示单词在文本中出现的次数):
再去掉出现频率极低的另一批单词:
剩下的这批单词就是我们高频词所在的区间了,再对这部分词进行筛选,我参考了柯林斯词典给出的词频统计表,去除了常见的前6000词以及部分地名,人名等专业名词,最终得到了这一份高频词表:
这份高频词表一共有2706个单词,涵盖了绝大部分经济学人文章中的“看起来有点难但又经常出现的词”,如果你能掌握这份词汇表的话,相信读起经济学人来会轻松不少。为了方便大家查看中文解释,我从有道词典上抓取了这2700多个单词对应的中文解释,一并放在词汇表里面,文章末尾会附上这份高频词表的下载地址.
怎么使用这份高频词表?
给出这份高频词表的目的并不是叫你去死记硬背,而是可以采取更加灵活的方式来掌握这些它们。你可以通读这份词汇表,然后选择不会的生词进行重点突破,比如查英英词典记例句,这里推荐一个学单词的网站:Vocabulary.com
这个网站超级强大,我认为是目前世界上最好的单词类网站了,为什么呢?我们来看看它是怎么解释一个单词的。
假如要对于”venerate”,一般词典都是这样解释的:
优秀一点的词典会这样解释:
但是http://Vocabulary.com 是这样解释的:
一目了然,生动形象,而且还把单词的使用场景镶嵌到解释当中了。除此之外,它还带有大量地道的紧跟国际潮流的例句,全部来自各大主流报刊:
这个网站的强大之处并不仅仅限于此,它还有一个list(生词本)功能,你可以自己在上面手动创建属于自己的生词本,比如这样(建议点开大图查看)
生词本建立后,系统会自动帮你制定单词的学习计划:
在这个过程中,你是在真正地在学一个单词,学习它的各种搭配用法,尝试着去造句应用,而不仅仅是停留在记住单词意思这个层面上。
如果你觉得创建自己的生词本还不满足,那么可以试试看这个:
http://Vocabulary.com 官方自己推出了众多生词本,内容涵盖了从最基础的1000词到SAT词汇,TOEFL词汇,GRE高频词,以及其他网友分享的词汇表,资源非常丰富。
你可以根据自己的需求把经济学人高频词表导入到http://Vocabulary.com,然后就可以在上面愉快地学单词了。值得注意一提的是,这个网站还推出了相应的app,(经指正,安卓版售价2.99美元),ios版售价18元,但绝对物超所值。
我在经济学人的12万词汇表中发现了什么?
我尝试着对550万词文本中抓取的这12万词进行了分析,得到了一些很有意思的结论。比如下面这个问题,经济学人(或者是英文文本中)最常见的十个词是哪些?下面的统计图给出了答案:
最常见的一个词是”the”,在550万词中它出现了20多万次,平均每25个词出现一次,而且频率远远高于其他词的词频。
又比如,经济学人这两年来对国内的哪家互联网公司关注度最高?百度,阿里巴巴,还是腾讯?
我统计了几家公司的相关词条,得到的结果是:
其中前三名分别是阿里巴巴,腾讯,小米(而不是百度),其中阿里巴巴关键词占据了将近一半比例(这可能与它去年的IPO有关)
对于国外的科技公司这一比例是:
最经常亮相的不是苹果,而是亚马逊。
又比如要查看经济学人对各个大国的关注度。除美国外(美国关键词太多了,不具有比较意义)的世界各大国中,它们的关键词出现次数为:
可以看出经济学人这两年对中俄的关注度之高。
从这份庞大的词汇表中还可以挖掘出很多有意思的结论,我把这份12万词汇的词汇表也一同打包放在文末下载,欢迎自行探索
经济学人高频词下载链接:http://pan.baidu.com/s/1eQ8gd5S 密码:3af0
安卓版http://Vocabulary.com 下载链接:http://pan.baidu.com/s/1dDiyoe9 密码:xabm
文件中包含有带解释和不带解释的经济学人高频词汇表,原始的12万词汇表以及柯林斯词典的14600高频词表。
另:喜欢读经济学人的同学可以关注下我的公众号:英文悦读,感谢!
—————————————————————————————————————————————————————-
2015.05.26更新
感谢知友@数据小生 在Vocabulary.com 上为经济学人的高频词汇制作了list,共享链接:
1 http://vocab.com/lists/673544
2 http://vocab.com/lists/673545
3 http://vocab.com/lists/673549
4 http://vocab.com/lists/673550
5 http://vocab.com/lists/673551
6 http://vocab.com/lists/673552
7 http://vocab.com/lists/673553
8 http://vocab.com/lists/673556
9 http://vocab.com/lists/673558
10 http://vocab.com/lists/673559
11 http://vocab.com/lists/673560
高频词表仍在更新完善中,有任何修改建议可以联系我。
来源:知乎 www.zhihu.com
作者:魏剑峰
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载