重生学神有系统
时间:2023-05-21 来源: 作者:一碗酸梅汤
他昨天就打算好了,做一个实用一点的软件。
界面部分可以放在以后再弄,今天先把最难搞的核心算法写出来。
毕竟人工神经网络,需要大量的时间训练
的技术要点,关键在于识别算法。
打印字体的识别,比手写识别简单多了,毕竟计算机常用的字体,也就那么几种。
江寒先从网络上,将各种字体文件全都下载了一遍。
然后设计了一个程序,调用这些字体,生成了许多小图片。
每张图片都是一个汉字、数字、字母,或者特殊符号。
江寒使用数据扩充算法,将每张图片略微变形、变色、位移、旋转
得到了数以十倍的样本图片。
并且,在生成图片的同时,还顺便生成了一一对应的标签。
这样江寒就拥有了海量的训练数据。
接下来,他又综合运用已经掌握的机器学习知识,设计了一个庞大的集成式机器学习算法。
其中不可避免地,用到了,也就是最新开发出来的“卷积神经网络”。
为了最大限度地提高识别正确率,整个网络包括了许多层级不同的子网络。
每个图块输入到网络中后,先由第一级网络进行粗分类。
将输入的图片,划分成汉字、数字、英文字母、特殊符号这四个大类,然后分门别类地送入四个子网络中。
如果第一级识别的结果是数字,那么就会送进一个类似于手写数字识别的小型网络中,进一步分类,看看属于09中哪一个数字。
英文和特殊符号的处理,也和数字差不多,只是输出结果的类别数,稍微大了那么一点点。
但如果经过第一级网络的识别,判断归属于汉字大类,那么处理起来就稍微复杂一些了。
江寒将5000个左右的常用汉字,划分成了4000个子集。
然后使用自组织聚类神经网络,设计了一个拥有4000个输出的分类器。
少部分子集只含有一个元素,意味着分类到这些子集中的汉字,可以直接输出识别结果。
大部分子集里含有230个元素,这意味着还需要送入第三级网络,进一步进行分类。
如果该子集中的元素,只有23个,那么就送进一个单字分类器中,识别出最终结果。
多于3的话,就送入细分类网络模块,进一步分类。
循环进行前两步,直到每个子集的元素个数都小于等于3,然后逐一送入单字分类器中,输出最后的结果。
这就是这个集成网络的整个工作流程,其中使用了数百个中型神经网络。
这些神经网络在设计上,基本大同小异,所以编程难度并不高。
麻烦的是,每个神经网络,都得单独训练,而这需要大量的算力。
好在他早就在高新区地下的机房里,准备好了十几台高性能服务器。
江寒将程序设计出来,然后连同训练数据,一起上传到了那些服务器中。
十几台服务器全力运转,差不多一两天就能完成训练。“”看小说,聊人生,寻知己~
(iishu)是,,,,!
第386章 测量“虚拟空间”的曲率
【】(iishu),
接下来,江寒又设计了一个抠图算法。
在实际应用中,原始文件以打印稿的扫描件为主。
由于图片质量参差不齐,在识别之前一般要做些预处理,例如:矫正文本位置、去噪声、二值化等等。
具体的说,先要分析图像的光照特性,获取光照分布。
然后进行边缘分析,得到图像的边缘分布模型,得到总边缘权值。
接下来,再计算出图像的模糊程度,得到图像模糊度权值b。
这样就可以利用、、这些参数,对图像进行二值化。
此外还要填充空白,防止图像产生断裂,并对离散的点进行分析,排除噪声点
预处理完毕,才能把图片切割成一个个小块。
切割的时候,先对图片进行水平投影,找到每一行的上界和下界,将原始图片切成一行、一行。
再对切割出来的每一行进行垂直投影,找到每一个字符的左右边界,切成一个、一个字符。
切割出来的一个个小块中,只允许包含一个字符。
此外还要将这些小图块进行缩放处理,有需要的时候还要进行对齐处理,最后才能送进集成式神经网络进行识别。
中午时间只有1个多小时,自然做不完这么多事,时间差不多了,江寒就叫醒夏雨菲,一起去上学。
然后整个下午,他都在研究原子物理,晚上回家吃完饭之后,就回到自己房间,继续编写代码。
忙到晚上9点多,终于搞定了大部分程序。
至于那些神经网络,则还需要一段时间,进行训练。
看看时间不早了,江寒就将目前的工作,进行了一下备份,然后洗澡、上床、睡觉。
说是睡觉,其实是打算进入虚拟空间,继续愉快地玩耍。
然而他刚钻进被窝,就有人敲响了房门。
这个时间来敲门
江寒不由得会心一笑:“进来吧。”
声音刚落,夏雨菲以全新的姿态,推门而入。
江寒顿时瞪大了眼睛。
她这是的哪个动漫人物吗?
这裙子也太短了吧?
还有这萝莉风的扮相,也太诱人了一点吧?
自己虽然没什么萝莉控倾向,看了也有点把持不定了!
估计夏如虹又没在家,不然的话,这身衣服只怕会成为“妈见打”系列。
半个小时后,夏雨菲脸红红地离开了,江寒仍沉浸在那如梦如幻的“奇遇”中。
不得不说,这次的体验真的很难得、很奇妙。
然而
江寒感受着身体上的亢奋,不由得叹息连连。
虽然刚才那个“游戏”挺好玩的,可就是有点容易导致失眠
好在他本来也没准备睡觉,眼睛一闭就进入了虚拟空间。
虚拟空间里,机器人仍在一丝不苟、片刻不停地刷分。
今天上午、中午、下午,江寒每隔个把小时,就抽时间进来看一眼。
结果还算让人满意。
绝大多数时间里,机器人的运行都相当稳定,只在下午的时候,出了一点小故障。
不知什么原因,电动车偏离了“铁轨”,于是,为了避免更加严重的错误,主控程序保护性地“停机”了。
江寒发现了之后,将系统复位了一下,机器人就又能正常地工作了
江寒检查完机器人,就开始考虑今晚做什么。
每天晚上可以在这个空间里,度过无比放松的几十、上百个小时。
这么长的时间,不做点什么的话,就真的太浪费了。
然而,软件没完工之前,还没法实现在虚拟空间里学习的美好愿景。
因此江寒想了想,就做出了一个决定。
利用这难得的闲暇时间,测量一下这个空间的大探究一下这个空间的“形状”。
这个空间肯定不是向四面八方无限延伸的。
无论怎么想,这个空间的规模,也不可能比外面的真实宇宙还要庞大吧?
所以
这里要么是有边界的,要么就是一个曲率不为0的时空,只要沿着某个方向一直前进,就会回到原点!
但是,别说空间的曲率了,即使是平面的曲率,也不是那么容易测定的。
如果一个人“笔直”地向前走,那么即使是完全平坦的“地面”,也一定会回到原地。
这是因为人的双脚长度、力量有着细微的差别,只能走出一个巨大的圆弧
换成车子也是一样,车子两边的轮子状态,一般都无法保证完全一致。
气压、直径、磨损程度等方面,略微有点小区别,就不可能沿着直线行驶。
要想保证方向上的不变,必须拥有某种“导航”机制。
可惜的是,这个空间里并没有星星,而其他可靠的导航手段,江寒暂时也没有找到。
所以他琢磨了一下之后,就决定分两步走。
第一步,先确定一下,脚下的“大地”究竟是平坦的,还是弯曲的。
这并不困难。
江寒先在商品列表中,购买了一些元器件,然后迅速地鼓捣了起来。
先用功率较大的激光二极管,搭配一组聚焦镜头,制作成简易的激光器。
为了防止烧穿,他还特地制作了一个限流电流。
接上电源后,激光器就射出了足够笔直的光。
接下来,江寒又制作了一个能微调角度的三脚架,然后将激光头固定在了上面的托盘中。
这样一个超简易的“测距仪”就做成了。
江寒一共做了三个“测距仪”,又在三张一模一样的纸板上,画满了同心圆,粘在激光头后面,作为靶子。
随后,他将测距仪放在工作台附近,就带上剩下的两个测距仪出发了。
由于要走的路比较远,江寒还特意让刷分机器人暂停,然后在电动车上装了一个小开关。
这样他就能手动控制车子启动、熄火了。
江寒坐上电动车,一直开出了五公里左右,才让车子暂停。
然后下车,将测距仪竖在地上,打开激光头,耐心地调整角度,让激光射在测距仪的靶心正中间。
点搞定之后,他将电动车扭转大约60度,再次前进了5公里左右,来到了点。
然后按照同样的方式,放置第三套装置,并让测距仪的激光,射在测距仪的靶心。
最后他又回到,让测距仪的激光射在测距仪的靶心。
这样江寒就利用激光,在距离地面不到两米的位置上,做出来一个巨大的三角形回路。
接下来,他需要一个精密一点的电子量角器,来测量一下这个三角形的三个内角。
三个内角的度数之和,如果正好等于180度,那么很明显,地面就是无限接近平直的。
但如果大于180度,那么这个看起来极度平坦的“地面”,就很可能是个曲率为正的曲面。
也就是说,和地球的表面差不多
电子量角器有多种实现方法,有用多圈精密电位器的,也有用霍尔效应传感器的。
后者的精准度更高一些,但实现起来也要稍微复杂些。
好在江寒并不需要什么东西都自己。
这类基本的工具和元器件,商品列表里都有提供,只需花费一定的积分,就能购买到了。
江寒毫不犹豫地购买了一只霍尔效应量角器。
然后绕着激光大三角形,又跑了一圈,将三个内角的度数一一测量了出来。
最后,把三个数往一起一加
江寒顿时倒吸了一口凉气。“”看小说,聊人生,寻知己~
(iishu)是,,,,!
第387章 打印机和绘图仪
【】(iishu),
这个三角形的内角和,竟然是179度。
这明了什么?
脚下的地面,竟然是个曲率为负的曲面,比如马鞍面?
不!
江寒仔细思考了一下,就察觉到了一件事。
自己之前的想法有谬误。
这个实验结果应该和地面的曲率无关。
光在均匀介质中总是走直线。
换言之,只要空间是平直的,那么这个三角形的内角和,就应该正好等于180度。
而不管脚下的“大地”,到底是球面的一部分,还是什么其他奇形怪状的曲面……
那么现在179这个数字,又明了什么呢?
江寒心中升起了一丝明悟。
空间曲率!
猜你喜欢