奶奶的机器人九号
繁体版

第二章.阿尔法狗与多元关联

    世间的一切事物相互之间都存在着联系,不管你承认不承认,这种联系是客观存在的,人类的思维以这种联系作为路径,不管你思考不思考,思维的路径都在那里。

    几年过去了。

    “老爸,您说,会下围棋的阿尔法狗算拟脑智能吗?”快高考的林久浩一直在寻找着林自强说的拟脑智能的例子。

    “不是”老林淡淡的回答。

    “ifthen?”林久浩。

    “要复杂一些”林自强。

    “怎么做到的?”林久浩。

    “穷尽步骤,积累参数比对择优,这个办法比较土,因为需要消耗很大的算力”林自强。

    “什么是穷尽步骤积累参数比对择优呀?”林久浩。

    “当你走了一步棋,计算机就计算所有可能的下一步棋,然后再依据所有下一步棋,再计算它的下一步棋,然后继续穷尽步骤,在这个过程中积累一组设定的参数,通过比对参数择优输出结果,记住择优”林自强强调择优二字,因为人工智能选择不可避免的需要大量‘比对择优’。

    “步骤穷尽的话,叠加计算量会很大的,很消耗计算机的算力,就没有别的好办法了吗?啊~老爸”现在的林久浩已经学会一些编程技巧了。

    “我们知道,一盘棋局每一方最大步数不会大于180步,但是计算机也不用推演过多步数,可能就推演五步、十步、十几步,不过这样也会消耗不少算力的”林自强。

    “就这些吗,还有没有其他的方法”林久浩。

    “有,把历史著名的棋局全部输入计算机,做成样本,然后在比对择优的时候,有样本的下法权重高”林自强。

    “样本就是数据内容吗?”林久浩。

    “不全是,不等同,样本是处理后的数据内容,需要做关键字类的索引,然后做定量定向定性定质等等处理”林自强。

    “老爸,什么是定~定~定~定~定~定~定~的”林久浩继续问。

    “定量就是把内容做成固定大小的范本模型,定向就是规定使用用途,例如围棋名局用于阿尔法狗等围棋类人工智能,定性就是规定正负善恶,例如你持白棋,白棋赢局就是正的,而黑棋赢局就是负的,定质就是制定权重,比较复杂的,还要形成特征码用于索引等”林自强。

    “阿尔法狗怎么会一直赢棋呀?”林久浩。

    “狗会选择胜的一方下法,如果胜的棋局很多,就积起来,用算法让它们择优,择优比对出最优的结果”林自强回答。

    “择优算法是什么?”林久浩。

    “就像用同一个筛子模型筛豆子,把筛出来的豆子积起来,然后调整筛子孔的大小再筛,直到得出最大或者最小的。。。豆子”林自强。

    “您的意思是,狗把历史棋局样本积累起来,选赢局,赢局选赢目多的,选择出最好的?”林久浩问道。

    “对,基础的算法理论模型差不多吧,只是不能按赢目多少选择,而是以权重参数选择”林自强。

    “什么是权重?”林久浩。

    “样本在开始定质的时候就定义权重,例如一盘大胜的棋局,但是这个棋局是因为后期对手走出了一步臭棋导致的。这种棋局,样本库可以放弃采用,但是不能撒谎,所以如果采用的话,可以给它定一个性质,虽然是赢局,但是权重很低,在计算的时候是被筛选出去的”林自强。

    “筛选就是调整阈值,无限IFTHEN。。。。。递归?”林久浩。

    “你现在Python学的不错,编程思路也不错,理解很快呀。不过,对于狗来说,围棋还有中盘胜”林自强

    “中盘胜,不算目数,怎么择优呀?”林久浩。

    “先分叉判断,有中盘胜,且权重合理,就直接选择了”林自强。

    “哦,也是,所以狗一直赢?”林久浩。

    “可以一直赢,除非它样本库里出现臭棋棋局,胜方的下法并不高明”林自强。

    “有这种可能吗?”林久浩。

    “样本都是围棋名局,这种情况的概率很低,而且还有穷尽步骤参数积累的方法,同时配合目数计算,基本不会出现怪异情况的,即使有,后期也会人工修复”林自强。

    “老爸,如果,我说如果,我走出历史没有的招数,狗就不会应对,是不是可以赢阿尔法狗”林久浩略有得意的说。

    老林看了一眼林久浩“你想多了,你要知道,不管你用黑子或白子,你只有50%的主导权,如果你下了一步无效棋,狗都会判定你放弃主动权,狗会按照先手棋去走”。

    “没有懂,老爸,我就是走一步前无古人后无来者的棋”林久浩抬杠上了。

    “例如你开始走在1·19点,历史估计没人走,但是狗会判定你走了无效点,而直接以先手棋下棋”林自强。

    “如果不是开局哪?”林久浩。

    “棋子走的越多,历史棋局越多,狗的命中率越高,如果走到后面,真的出现样本库中没有的,那就模糊计算找相近点,它不是还有穷尽步骤的算法嘛!找一个参数值好的输出就可以”林自强。

    “那相近点也没有哪?”林久浩。

    “你抬杠了,没有怎么了,那就输一局,下回就有了输局,采样择优还有一个原则,不选择输局”林自强。

    “哦,即使输一局,但是狗的样本库会更丰富,对不对?”林久浩。

    “是呀,其实阿尔法狗,把棋谱和一些固定应对等围棋教程也记录为样本,这样比人脑记录的多”林自强。

    “老爸,那是不是我现在用python也可以编这样的程序”林久浩。

    “可以吧,你要用递归穷尽多少步骤?算力消耗太大,如果建立样本库,整理的数据量和工作量都很大,没意义。。。别想了,快高考了”林自强阻止了林久浩。

    “哎~,以后棋手都下不过狗了,就不需要围棋比赛了”林久浩替棋手们叹了口气。

    “久浩,你可不能这么想,包括围棋在内的各种棋类比赛都是考验人脑的,所以比赛都是人与人的较量”林自强。

    “可,人脑比不过计算机呀!”林久浩。

    “没有能比过机器的,跑步跑不过汽车,游泳游不过人造海豚,铁饼标枪哪个有机器扔的远,拳击打的过机器人吗?反而是棋类,是机器人最后超越的比赛领域”林自强。

    “那是不是都不要比赛了”林久浩。

    “体育比赛是发扬人类的体育精神,是人与人的公平较量,引入机器就没有奥林匹克了,体育不只是看结果”林自强。

    “老爸,如果是您,您怎么做人工智能?”林久浩问出了关键问题。

    “你是说狗,还是拟脑”林自强。

    “拟脑狗”林久浩。

    “你可能会失望了,拟脑狗不如穷尽步骤及样本阿尔法狗,除非它长大成人”林自强。

    “为什么?”林久浩。

    “我的拟脑智能理念是建立智能大脑,你知道现在的资料库样本库吗?它们的存储可以用有序化索引化来表现,而这不是拟脑化”林自强。

    “拟脑的资料怎么表现,你总说要先有一个大脑,到底是什么样的大脑,不是样本库吗?”林久浩。

    “信息需要智能的连接在一起,这种连接不是以索引和有序作为连接条件的,而是以关联关系作为连接条件”林自强。

    “关联关系?我现在编程,我知道信息数据有序化,信息之间关系是以文字定义的,即关键字索引分类方法,即使是关系型数据库,同样是靠关键字索引的”林久浩。

    “嗯,你对现在的数据库模型,理解的不错”林自强。

    “老爸,你说的智能化关系结构,不是这样的数据库吗?如果不是,那么它怎么存储信息的?”林久浩继续问。

    “把信息转化为信息元,构建一个多元关联模型数据库,将信息元放置到元位置上,然后将有关系的元之间连线,元之间的连线就是关系,关系可以做相应的定义,例如距离角度和权重等等,而这条连线就是拟脑的思维路径”林自强。

    “信息元,多元模型,连接关系,思维路径,还是第一次听到。”林久浩。

    “你抓到重点了,多元关联拟脑模型就是一个大脑,只不过在没有信息元存储的时候,它是空白的,但是这个空白不是虚空,是一个大脑结构,可以创建无数的信息元节点,及节点之间的连接关系”林自强继续介绍。

    “信息元是什么?”林久浩好奇心膨胀了。

    “信息元是由数据内容信息浓缩抽象后导出的关键标识,我们把它定义为信息元,或者信元,或者息元,或者元”林自强。

    “例如?”林久浩。

    “例如,你,我,你母亲,你奶奶,你妹妹,都各自为信息元”林自强。

    “我和您们四人都有关联关系,而您们四人之间也有相互的关联关系,如网状的,每一条关联关系都不同”林久浩。

    “对,这就是我的多元关联拟脑库模型1.0的思路,信息元之间的关系定义在连接线路上,用距离角度和权重来定义优劣,然后再引入到三维坐标系中”林自强。

    “为什么要引入一个坐标系?”林久浩。

    “这样,当触发一个信息元的时候,以这个信息元为原点,所有信息元通过矢量线段连接,定义的距离角度和权重都可以起到比对择优的作用。”林自强。

    “这个线路有什用处?”林久浩。

    “线路是思维的路径,我们再重新举一个例子,例如医学范畴的”林自强。

    “不用刚才的人物了?用医学来举例,好的,线路有什么用?”林久浩继续问。

    “思维路径,一个人如果生病一定有症状,症状又与病有关系,病与医治方式有关系,医治方式与药物有关系,药物作用回到病人,症状就会消失”林自强。

    “我可以这么理解,人,症状,病,治疗,药物,效果,都是信息元,而且这些信息元之间有关系”林久浩

    “对的,不管人生不生病症,后面的信息元都存在关系,当人与病症发生关系,那么这个思维闭环就形成”林自强。

    “思维闭环又是什么?”林久浩继续问

    “我们刚才说的,人-症状-病-治疗-药物-预见效果-作用回到人的效果,这个需求是从人出发,最后作用回到人的过程,就是一个思维闭环”林自强。

    “如果是拟脑智能,就可以按照这种关系形成闭环,这就是一个自动思维的过程,对吧?”林久浩。

    “对的,你理解的非常快”林自强。

    “信息元会很大吗?这个模型我可以尝试编程,如果信息元是信息的编码,那么,例如症状与治疗方法都是信息元,不同的信息元在字段占用问题上,差异会很大,有的可能是几个字节,有些可能是成百上千字节,怎么办呀?”林久浩进入角色了。

    “不同的信息元在字节占用上没有差异,因为都会形成信息元编码,这是固定格式的编码,而每一个信息元真实数据信息内容可以采用传统数据库,或者传统数据流文件存储,而信息元编码又是这种传统存储资料的索引”林自强。

    “您的意思,多元关联拟脑模型库中只存储信息元编码,而具体内容由信息元编码为索引的传统存储方式完成存储,是吗?”林久浩。

    “对的,不过,多元关联拟脑模型库中,不只是信息元编码还要存储信息元之间的关联关系”林自强看着林久浩,纠正了一句。

    “老爸,这个,我能给您编一个模型出来,很容易的”林久浩很自信。

    “确实,基础模型不复杂,采用三套开源数据库,分别存储信息元格式和信息元的内容信息,然后在构架一个信息元编码索引库,再编制一个带路径扩散控制的思维行走函数,再编制一套界面程序,再编制简单的展示界面,估计编程的代码量在万条左右吧,信息元数量限制定义在十万以内,基础模型确实不难”林自强。

    “没问题,即使突破十万信息元,还可以用多套模型合作存储计算,老爸,我很快就能做出来”林久浩对自己的快手编程能力很自信。

    “现在不行,你要能分清主次,你现在要把心思放在高考上,高考结束了,我们可以一起做个模型出来”林自强。

    “老爸,您觉得这个思路对吗,多元关联拟脑库模型一定是科技发展的方向吗?会有实际用途吗?”林久浩现在考虑问题已经相对全面了。

    “思路肯定是对的,但是不一定是最好的,这需要进一步研究。关于用途,一定会有的,不过,现在我也在找一个用途,小规模的应用场景”林自强。

    “围棋可以吗,干掉阿尔法狗”林久浩。

    “需要很长时间,而且也要打谱,学习样本”林自强。

    “那,与阿尔法狗有什么区别?”林久浩。

    “阿尔法狗是以样本库资料为基础,模仿下棋的步骤,多元关联拟脑是学习棋子之间的生杀紧密关系,所以需要很长时间”林自强。

    “那,成长以后哪,干掉阿尔法狗?”林久浩。

    “不行,成长以后最多也就是一个超一流棋手,跟阿尔法狗不相上下吧~”林自强。

    “就是不如阿尔法狗了,永远不如狗了,那有什么用?”林久浩。

    “你忘了,多元关联拟脑库模型不是给围棋用的,这个拟脑模型在任何领域都可以成长,自动思考,而阿尔法狗永远只是下围棋,只在围棋的样本库中成长,只知道结果比对择优的赢棋。”林自强。

    “对哦,是呀,我们是任何领域通用的模型,而且是知识与思维的成长,不是专用算法和单纯样本库成长”林久浩反应很快。

    “好了,你复习功课去吧,考不上好大学,你就。。。会。。。”林自强不知道说什么。

    “我就完蛋了,找不到好工作了,孝敬不了老人了,妹妹就吃不上饭了,是不是?”林久浩把平时的警告串在一起。

    “不是,考不上好大学,咱俩就一起,专门搞拟脑智能吧!”林自强。

    “会的,会考上的,放心吧老爸”林久浩。

    《示意图》:《信息元关联模型及传统存储结构示意图》。