超级U盘
时间:2023-05-23 来源: 作者:纸火花
因为未来还需要制作推出更多软件,所以并没有直接搭建蜜蜂输入法的官方网站,而是将其作为蜜蜂软件旗下的子站点。当然,fpyfsrfieifengpinyinifengshuru这些域名太丑也是一大原因。
第十八章 科学计算
马竞把电脑上所有3294个专版词库打散重组,重新制作了一批诸如全国人名词库全国大学词库中学生词库艺术爱好者词库军事爱好者词库中文游戏词库全球游戏词库全国地理词库全球旅游词库动漫acg词库网络热词流行语词库现代汉语词库中文出于词库唐诗宋词词库英文格言词库英美俚语词库现代网民词库各地方言词库等等,各式各样的词库,上传到蜜蜂软件的服务器上面,提供给全国网民免费下载。
蜜蜂输入法还会在其使用过程中,自动生成用户自造词词库,用户也可以像拼音++一样,自行添加删除自定义词组,甚至一大段文字。
所有这些本地词库都会在使用过程中根据词频和关系数据库即时调整次序,同时属于用户专属的关系数据库也会积极的为用户使用过的各种词语建立关联。比如把用户的名字和经常输入的学校名字班级名字联系起来等等。不过这种自动生成的动态关联也比较脆弱,很容易被其他高频关联置换,以保证整体的与时俱进。
蜜蜂输入法升级到1。0公测版,除了修改了升级服务器的ip地址,正式允许用户上传下载用户词库以外,还新增了两大杀手锏功能。
第一个新增功能是由自定义词组功能发展来的字符画功能,分为两个大组。
第一组是字符表情颜文字,即日式表情符号,使用各种字符拼接成类似人脸的表情和动作。不同于美国人发明并传遍世界的:):b,日式颜文字组合更多,而且也不需要转头九十度了。像是这样搞怪,或者_一样可爱,都是颜文字。
另外一组则是传统的拼接字符画,类似╳╪────────这样的简单字符画,以及网友们精心设计的美人鱼鲸鱼房子大船等等复杂字符画被蜜蜂输入法大量收录。
每组字符画都要对应的中文名和拼音简写,在输入时既可以通过拼音输入时选择特定候选词而插入字符画,也可以通过使用快捷键v或者其他键呼出字符画列表,在扣扣聊天或者论坛回帖式插入一段颜文字或者一幅字符画都是轻松加愉快。
另外一个强力新功能这是火星文翻译功能。
蜜蜂输入法1。0在原来就有的简繁切换功能以外,还增加了对火星文的双向翻译功能。
火星文是源自宝岛湾湾的一种将错就错的书写方式,网友们把简繁异体汉字甚至日语汉字乱码汉字等拿来替换与其音似或者形似的汉字,形成类似加密的特殊效果,比如把我是一个好孩子转写成誐4ㄚi箇好孩孒,甚至挖煶壹個ぬ陔囝。
火星文追求的就是一般人看不懂我的个性,但你能懂我那种会心一笑的感觉,不得不说这是属于华语区网友的专属乐趣。唯一形意合一的汉字才可以这么玩,那些从小说拼音语言的孩子妥妥玩不了的。
但是大量使用火星文也会带来不方便,因此网络上出现了火星文转换器,帮助网友把普通词句网名翻译成火星文,或者把火星文翻译成正常文字。
新版蜜蜂输入法增加的两个功能,本质上其实是软件增加了两个特殊的词库:字符画词库和火星文词库。不过是马竞在输入法程序上面为这两个特殊词库的调用增加了额外的接口罢了。
马竞升级了蜜蜂输入法服务器以后,在线用户开始陆续收到了升级提示。
在宿舍上网的文琦看着眼前的升级提示,一阵无语:昨天刚刚下载安装的,今天就升级了,真是有够折腾!
不过最后他还是点击了立即升级按钮,因为升级提示里面说了,新的1。0版本将正式支持词库上传下载,并且增加了两样新功能,看起来蛮有吸引力的。
作为一个踩在80年代尾巴上的家伙,文琦他们既不像典型的热爱八位机和俄罗斯方块的80后,也不是真正网络一代的90后。所以他对明显更合90后网友口味的火星文并不怎么感冒,反倒是字符画功能比较合他的口味。
在新版蜜蜂输入法的设置界面上一项项翻看,文琦又发现了一个小惊喜。
蜜蜂输入法原本就支持自定义词组,不过新版对其进行了加强,在原来的支持将不大于128个字符的中英文字符串设置成自定义短语的基础上,增加了排版模式和科学公式模式。
排版模式通过一个类似微软ord的编辑界面,可以通过它更方便设置一段文字的排版字体字号颜色形状等属性。并且可以方便的插到扣扣聊天框里面,而且为了保证最大兼容性,还提供将排版结果保存为图片的功能。
科学公式模式更是让文琦惊喜异常,蜜蜂输入法提供了一个比ord的公式编辑器更加好用的公式编辑器界面,同时还有完整版科学公式编辑器插件可供下载。
蜜蜂输入法标配的公式编辑器可以支持简单的大概是中学层次的数学物理化学公式的编辑,但是对于文琦他们专业课要用到的各种高等数学微积分解析几何流体力学热力学的科学公式就像ord的公式编辑器一样抓瞎了。而到了大二年级已经开始被老师要求写一些论文的文琦他们,对于如何在ord里面插入科学公式可是一直很头疼的。
好在还有完整版科学公式编辑器,下载安装了这个将近100b的超大插件(蜜蜂1。0本体才12b)之后,文琦发现,完整版果然像简介里面提到的那样,提供高等数学大学物理大学化学大学热力学等等专业科学计算的公式编辑功能。
独乐乐不如众乐乐,文琦立即把这个完整版公式编辑器的界面截图,发到了班级群和校园论坛上面,为蜜蜂输入法贡献了不少注册用户。
这个完整版科学公式编辑器其实是马竞分析吸收三大数学软件:atlabatheatica和aple的副产品。
e7u作为马竞的副脑,其源自外星科技的计算能力无比强力,但是它对地球目前的科学体系知识体系的了解大部分来自马竞自身的记忆。后来随着下载大量高中教辅材料,e7u的地球科学观才慢慢成型,不过因为没有最佳算法可供参考的关系,其对付高三数学和理科试题的解题速度还是不够快。
发现这个问题之后,马竞就上网求助,在度娘知道上提问怎么用电脑算数学题?很快得到了答案,就是安装数学软件啊!三大数学软件:atlabatheatica和aple,连原子弹都能给你算出来!
然后他就很天真地去找这三大数学软件了,其实这三大数学软件虽然在国内外享有盛名,但是都需要一定的基础和学习训练才能掌握的,初学者面对充满了各种符号和公式,以及英文界面的软件,妥妥是会抓瞎的。
不过马竞会抓瞎不意味着e7u会,三大数学软件以及其他一些科学软件都被e7u兼收并蓄了,吸收了其中的各种数学科学算法以后,其对地球的科学知识体系的理解能力也激增了不少。
当然,现在马竞去做理科题目的话,基本上能够保证瞬间得到最终答案,不过解题过程还是没有,让马竞非常郁闷。
第十九章 图解
马竞这几天自己做题时的就发现,对于数学和理科,e7u可以提供100正确的答案了!当然要么没有解题步骤,要么给出的解题步骤完全是马竞完全看不懂的软件编程代码解答,让他非常头疼。
表面上看来,e7u吸收了三大数学软件以后,只是提升了解题的速度,答案的品质还是不让满意。
但实际上,吸收了这些数学软件的算法以后,e7u可以给出物理题数学应用题的拟真动画。让马竞直观了解三棱镜是怎么分解白光的带电粒子是怎么在两块加电金属板之间运动的金星是怎么绕着太阳转的。至于把题目里面平面的示意图转化为3d立体图像更是很容易的事情。
因为借助e7u提供的拟真动画,马竞对这些题目的细节变化了如指掌,不像以往需要费神发挥空间想象力,相应的成绩也有了不少提高。
当然他本来成绩就不差的化学和生物成绩也在这样可以随时拟真体验的过程中得到了长足进步。
当然,遇到不太会做的题目,马竞还是需要费力拼凑解题过程,自己搜肠刮肚解几步,从e7u给出的正确答案向题目条件反推几步,凑成解题步骤,然后加上e7u提供的精妙示意图。至于最终能够拿到几分,他也没有把握。
即使一些题目e7u可以提供解题步骤,但是马竞很快发现这些解答不是用的高中水平解答的,而是使用大学层次或者高中水平的算法来解答,至于这么做有没有问题,还得回去问老师。
毕竟高中水平的题目,很多条件都故意忽略,都是各种理想状况下,用大学水平的解题工具来做有些牛刀杀鸡的感觉,而且也有可能引起阅卷老师反感——毕竟标准答案不会提供用大学知识解题的步骤,需要阅卷老师用自己的知识水平来人工检查,平白增加了工作量。
蜜蜂输入法新增的完整版科学公式编辑器便是e7u吸收了三大数学软件之后得到的一项副产物,原本是为了扫描识别纸质书籍上面的公式而特意设计的。当时做出来是简版公式编辑器,一方面e7u可以快速扫描读取马竞看到的实体书的内容,后来因为马竞需要看一些奥赛书的关系,被升级成完整版以便识别奥赛书上面大学水平的各种公式算法,这次马竞干脆把两个版本都拿出来放进蜜蜂输入法的更新里面。
马竞有时候还会遗憾一下,奥数和理科竞赛的时间都已经过去了,该拿到加分名次的人都已经拿到了加分证明,他今年是赶不上趟了——除非他复读,然后参加今年下半年的几门竞赛。当然这是不可能的,他又不是不是北清人,名校录取也不上那种奇葩。
其实很多名校录取也不上的人,并不一定是奇葩地只认准某家一流大学进行多次报考,他们中不少人其实是职业考霸。各地教育部门以及地方政府还有高中因为政绩和面子问题,通常会对考上名校取得某某状元的学生进行重奖,通常有几万元。
以至于一些擅于高考的人发现了这条生财之路,用成绩换奖金,成了高考专业户,甚至有人30多岁了还乐此不疲。对于能够为本地中学带来名校录取通知书的高考专业户们,地方教育部门和高中都是默许甚至欢迎的,至于被录取却不去上,浪费一个名校招生名额,那都不是事儿,谁让你是第二名呢?
不过可以肯定,马竞同学今年必然要抢走本地区不少高考专业户的生意。
在把蜜蜂发布器服务器版上传到现在还很闲的蜜蜂安全服务器上并运行以后,马竞终于把他挂机两天的网吧电脑关机了,跟网管打招呼,结账离开了。
相对于已经获得数十万用户的蜜蜂输入法,蜜蜂安全就比较惨了,现在才三千多的下载,更加来源分析,很多人都是从蜜蜂输入法网站页面下方的友情链接找到的蜜蜂安全网站,然后其中一小部分下载了蜜蜂安全0。9公测版。
对此情况马竞倒是完全理解,既然蜜蜂输入法发展的好,优先发展输入法也是不错的。尽管蜜蜂输入法并没有在三十万用户那里找到那个人,马竞苦苦追寻的那个肇事司机。
服务器版的蜜蜂发布器改进了整站下载机制,对于有价值文本文件的搜寻效率大大提高,不再需要一股脑儿下载所有文本文件了。其行为也更加像是搜索引擎的网络蜘蛛程序。
搜索引擎借助网络蜘蛛程序自动下载网络上的各种网页内容,并为其建立索引和排序。用户输入关键字进行检索时,搜索引擎就从自己服务器的索引中搜索结果。所以没有任何一家搜索引擎可以真正搜索全网,它们实际上只是搜索自家网络蜘蛛爬过的内容,天然具有一定的滞后和不完整。所以越是大公司的搜索引擎越是好用,因为它们的索引数据库更加全面。
所以作为全球搜索引擎巨头,谷歌也拥有全世界最多的服务器,超过45万台,为全球超过80亿网页建立了索引(2005年),早在2004年,谷歌保存的索引数据就已经超过了5pb(1pb1024tb,1tb=1024gb)。
有意思的是,谷歌45万台服务器中的大多数都是使用diy配件组装起来的pc(个人电脑)级别的廉价服务器。没有使用性能更稳定,价格更高昂的服务器专用主板和硬盘,而是大量使用个人电脑配件,因此被人戏称是全球diy电脑最大消费者,也是民间用电大户。
当然普通个人电脑配件的稳定性自然没有更加昂贵的服务器配件效果好,因此谷歌使用大量备份镜像,系统会根据各台服务器的负载情况自动分配任务,保证每台可用服务器的负载都在安全范围内,并且及时排除死机出错设备的影响。
谷歌自己设计了gfs/apreduce/bigtable/这三个架构在linux之上的平台,将其45万台廉价服务器巧妙的组织起来,构成了这个星球上最强力的超级计算机集群之一。
gfs谷歌文件系统将数十上百亿网页的索引文件集中存放,形成一个个64b的文件块,通过分级管理,大大简化了海量文件的搜索管理难度。
apreduce是google开发的c++编程工具,用于大规模数据集的并行运算。它会安排多个计算机同时计算一个任务,一旦一台计算机有了结果,其它计算机就停止该任务,而进入下一任务。因为同时用多台计算机进行一个工作,个别计算机偶尔的宕机出错也就不会影响整体任务的执行了。
至于bigtable,这是一个用来处理大数据量的系统,适合处理半结构化的数据。
不过谷歌的服务器集群虽然强力,却没有报名参加全球超级计算机top500排名。
每年6月和11月,top500排行榜就会更新一次,目前最新的数据还是去年11月的排名。马竞也曾经去这家国外网站上去瞻仰过这些全世界最快的电脑。
第二十章 超级计算机
在这份榜单上,全球前500名超级计算机中目前一共有7组用于游戏服务,其中有5组运用在九村《o服务器。这五台惠普制造的bladeclusterbl20p,拥有8路(8个cpu),采用intel至强32位处理器,主频3。2g,以每秒3。076万亿次浮点操作的能力分别位列榜单的150至154位。售价更是高达15万美金一台,总重达40吨。
曾经进入前十的国产sg超级计算机以每秒8。061万亿次的浮点操作能力去年排名第42位,而第一名则由疯狂生长的的蓝色基因l继续蝉联(去年11月击败地球模拟器以后,它的体积增加了两倍,cpu数目超过了十万枚!)。
与之相比,国产超级计算机
sg4000a超级服务器,使用了总数为2560个ad64位apteron处理器,内存总容量为5tb,磁盘总容量为42tb,由四套不同的网络互联,峰值浮点运算速度为每秒11。2万亿次,linpack值为每秒8。06万亿次。
第一名的ib制造的蓝色基因l实现了每秒钟280。6万亿次运算的性能纪录,峰值速度甚至达到367万亿次,傲视群雄。但是他的cpu数目也是傲视群雄的,安装在美国能源部国家核安全局的劳伦斯。利弗摩尔国家实验室的蓝色基因l,它在64组机架中安装了131,072颗ib设计制造的poerpc处理器。
蓝色基因系列超级计算机的用户可以选择只装1组机架到64组机架全部装上,它们能为用户提供一套具有高度可扩展性的解决方案。
在2005年11月发布的top500,蓝色基因有19台上榜,前20名就有5台,并稳守冠军亚军。
曾经的冠军,地球模拟器是由岛国多家科研机构共同开发的矢量型超级计算机。地球模拟器通过在计算机内设置虚拟地球,以预测及解析整个地球的大气循环预测温室化预测地壳变动地震发生等大规模计算为目的而开发,其原形是nec公司的矢量型超级计算机sx5。
地球模拟器是由640台用来进行演算处理的计算节点和65台用于连接计算结点的网络设备构成。每个计算结点上配备有8个最大为8gflo(1gflo1秒钟进行10亿次的浮点运算)的nec产处理器和16gb的共享内存。计算结点和网络设备由通信速度为12。3gb/秒的网络连接,使用的电缆总长度达2800公里。整套设备共占用空间达3200平方米。
地球模拟器的开发始于1999年,开发费用总计达400亿日元,约合25亿元软妹币。
当时看到这些资料以后,把马竞打击得不清,对于中学思想政治课本上面国产万亿次超级计算机的自豪感也顿时消散一空。当时他就觉得没有国产芯的超级计算机不配称为国产超级计算机。他很奇怪为什么sg公司不使用2003年就公布的每秒2亿次计算(200hz)的汉芯1号,或者每秒5亿次计算(500hz)的龙芯2号。
猜你喜欢