加入收藏 | 设为首页 | 会员中心 | 我要投稿 | RSS
福书网
站内搜索: 高级搜索 如有淫秽信息或侵犯了您的版权请联系邮箱fushuwang@outlook.com删除

 

您当前的位置:首页 > 2021

你是黑科技大佬你不早说!(穿越重生)——量子星星

时间:2021-03-06 11:37:18  作者:量子星星
  现行算法距离构建强AI还远得很,新算法已经很久没出现过了。这个领域的人似乎失去了算法创新能力,一切都是在从前的基础上改、改、改。
  楼清焰说得很对,谢晋是个聪明人,他懂得了大多数人不懂的道理:哪怕一次次把自己放逐到起点,只要仍能前进一厘米,就好过一辈子在终点的幻觉里原地踏步。
  所以他离开强AI领域,投向了弱AI。他隔着不可平的山海望向那座泡沫围城,心里面没有别人以为的不屑一顾,只有不敢直视的热爱与梦想。
  人只要许了愿,总有机会去实现它的。就像楼清焰,曾经打算当一个替别人做梦的人,现在,他真的能替别人做梦了。
 
 
第10章 电子声带
  谢晋不知道楼清焰是怎么发现自己心思的,不过,老实说,他不太信对方的说辞。
  或许只是在安慰他吧。
  他当然不知道,地球确实不需要算法创新,因为现有的神经网络模型,其实就是强AI的初代技术。
  星际世界出现的第一个强人工智能,是用神经网络一层层堆叠而成的。它本质上是一台不断学习的机器,从许多样本事件中归纳人类逻辑,将之写入数据库或算法。
  当系统量级超过某个临界值,整个逻辑量就会极其庞大,涵盖人类所有思维方向,机器的行为模式也会无限接近人类。由此可以认为,量变引起质变,机器获得了自主思考的能力。
  要想达到这个目标,人工构建的机器神经网络,必须拥有不下于人脑的体量。然而脑神经元数量何其庞大?即使榨干超级计算机的最后一kb容量,也模拟不出这个结构。
  地球需要硬件更新,光子计算机勉强符合要求,最理想的还是量子计算机。但是,量子计算机是个比强AI还大的泡沫,它的研发至少需要三个前提:可控核聚变、脑域开发技术、基础科学突破。
  至于为什么,解释起来太麻烦,楼清焰也不打算告诉谢晋。
  谢晋没有纠结太久,很快就带他来到一台工作站前面。
  “董事长,既然要看电子声带项目,不如先看一下demo吧。这个版本已经非常成熟,只要再完成一些优化工作,就可以投入市场营运了。”他在鼠标上点了一下。
  音响里放出了一首歌,女孩子的声音特别甜美,音调有点怪异,衔接带有机械感,听着像是siri在唱歌。
  不过,比起vocaloid系列已经非常自然了。
  Vocaliod,大名鼎鼎的语音合成软件,超人气偶像初音未来的诞生基础。
  据说它最初是给音乐行业录制小样的,但是发行之后问津者寥寥。制作方一拍脑门,开了个脑洞:“我们不做音乐软件,做虚拟歌姬。”由此,初音未来诞生,虚拟偶像概念进入人们的视线。
  谢晋说:“设计软件框架的时候,我们对比了几款竟品,其中最普及的是vocaliod和utau。它们的实现原理差不多,预先录制人声,对人声排列组合,再加上音调,组成一支歌曲。”
  “我们扒了两款软件的框架,最后还是决定,放弃这种纯机械式合成,改为仿生式的。也就是基于机器学习算法的AI软件,我们把它命名为,电子声带。”
  “因为没有先例,研发期非常困难,不过第一个版本出来之后,给了人相当大的惊喜。制作出来的成曲,最差也能达到歌姬级别。”他点了一下鼠标,对楼清焰说,“董事长,来听听它说的第一句话吧。”
  音响里传出一个清朗的男声。
  “hello,world.”
  楼清焰顿时发现:“这是我的声音?”
  “这是大家投票决定的。”谢晋揶揄地看过来。
  不知为何,被点破心思之后,他反倒觉得楼清焰有点亲切。
  “还行,挺自然的。”
  “这是AI算法的功劳。”谢晋说,“我们设计了一种深度学习算法,软件会对音源库进行特征提取,用提取出来的特征信息进行训练,最终,为每组音源库生成独一无二的数据模型。基于这个模型,合成语音会自然许多。”
  “这还不是最理想的。最理想的那种合成语音,不用组合人声,是凭借AI算法的高智能,凭空生成声音。不过……”
  “不过你们没这个技术。”楼清焰说。
  他想了想,描述道:“声音的本质是震动,在音响里就是膜片的震动,这种震动由电磁场引起,而电磁场的控制方式,是线圈通不通电。通电为1,不通电为0。”
  “所以,计算机声音的本质是一串二进制数,是不同排列组合的1和0。这叫做数字信号。”
  “最理想的语音合成,不是组合音节,而是直接组合数字信号。”
  楼清焰:“我说的对吗。”
  谢晋实实在在地惊讶了。
  他一直以为楼清焰是个不学无术的纨绔,就算所有人都搞懂了计算机原理,他也不可能搞懂的那种。
  没想到他真的懂。
  楼清焰还没说完,他继而道:“理论上,AI软件通过深度学习,可以掌握数字信号的规律,构建一个数据模型,再基于模型生成语音。”
  “但是,这需要一个大前提——机器学习算法能直接从数字层做特征提取。”
  他问道:“能吗?”
  谢晋服了,这人为啥总是一下子问到最关键的地方。
  “现在确实没这个技术。我们设计的特征提取算法,主要瞄准声音的波形表现,频率、相位这些。”他简单地说。
  楼清焰又说:“不止缺这一个技术吧。做了特征提取,知道怎么归纳总结吗?知道怎么训练模型吗?会写算法吗?设想过这个计算量有多庞大吗?”
  谢晋:“……”
  楼清焰发觉有点说过了,遂拍拍他肩膀,鼓励道:“不过你们已经做得很好了,能达到这个程度非常了不起……嗯,下一步工作是什么?”
  谢晋:“……”看出来你是在敷衍了。
  “软件的构造有点臃肿,只有在工作站上才能流畅运行,下一步先考虑优化问题。”
  “好的。”楼清焰也就是随口一问。
  他不在意软件本身,得知已经有了AI语音合成的雏形,他来这趟的目的就已经达成了。
  谢晋研发的这款电子声带,其实还是提前录制人声,再进行排列组合。只不过基于AI算法训练的数据模型,会对音频波形进行修改,让声音变得流畅自然,更加真实。
  这款软件的局限性在于算法。音频领域的特征提取没有可参考前例,谢晋团队必须把数字音频研究透彻,然后基于其特性设计新算法——不仅是逻辑框架,还包括万恶的数学模型。这可不是一朝一夕能搞出来的。
  但是楼清焰呢,他脑子里有现成的。
  在星际时代,声音合成是一项非常普及的技术,宇宙人早就可以在编码层面生成各种声音,还出现了一种新职业,叫音频作家。
  类比于文学作家,音频作家就是直接创作广播剧的那种。
  声音合成算法,是入门智械编程学习的一个启蒙案例。可见它简单到什么程度。在地球上也可以实现,条件是几套新的数学模型,一台大型计算机。
  佳辉就有大型计算机,用作app服务器的,暂时关停服务器来计算软件,好像也没什么大不了的。
  楼清焰只有一个人,不可能写出一个完整的软件,不过他有谢晋的代码基础,只要实现了那几个数学模型,用大型计算机快速完成机器学习运算,就可以达成他的目的。
  嗯,他只是想让楼皓宸“说”几句话而已。
  谢晋不知道他老板正在酝酿多么黑暗的犯罪过程,他看着楼清焰,心里已经对他完全改观了。
  龙困浅滩,虎落平阳,却显得从容自若。落魄时不露难色,面对员工的消极嘲讽,姿态依旧那么强硬。他懂计算机,懂智能技术,并不是大家以为的那种不学无术的废物。最重要的是,他竟然懂他的想法。
  谢晋此时强烈希望佳辉能度过这个难关。因为他第一次真情实感地发现,楼清焰是个好老板。
  他暗暗看了对方一眼,正听到他说:“就这样吧,参观完了。下一步,用一天时间学会c语言。”
  谢晋:“……?????”
 
 
第11章 拦路送钱
  楼清焰可不是开玩笑的,离开公司他就到图书馆借了一堆书,找了开锁公司回家,一边敲电脑一边钻研。
  于是,接下来的十多个小时里,谢晋同学崩溃了。
  每隔一段时间,他就会收到老板打来的电话。
  “喂,谢总监吗,我正在看数据结构c语言版,问你个问题……”
  “谢总监呀,计算机组成的知识你还记得吗,我问一下……”
  “谢总监呐,这一版算法设计与分析,里面有这么一个案例……”
  谢晋的心理活动,从一开始“是不是在逗我”,到中间越来越沉默,到最后陷入对人生和世界的深刻怀疑。
  要是他没听错的话……楼清焰大概可能也许……在一天时间里……读完了《数据结构》、《计算机组成原理》、《算法设计与分析》这三本书……???
  还是从零基础开始,一边读一边操作,一边问一边学,举一反三,把他都问到哑口无言的那种?
  小组例会中途,电话又打进来。
  接完,他瞪着一双梦幻迷惑的卡姿兰大眼,坐回去,对组员们提出了一个充满茫然的问题:
  “你们说,我大学四年,到底都干了些啥?”
  组员:“???”
  晚上九点钟,刻苦学习十二小时的楼清焰再次出现在公司,拉着谢晋给他开小班上课。
  谢晋不知道揣着什么心情,就去了。
  上课上到十二点。
  楼清焰:ojbk,出师。
  谢晋又不知道揣着什么心情,就下班了……
  楼清焰开始尝试完成那几个数学模型的代码实现。由于地球没出现过类似的数学理论,函数库里一点现成的东西都没有,必须生造,这个过程一开始进行得特别艰难。
  他摸索了一阵子,决定简单粗暴一点,完全不考虑算法复杂度、代码冗余的问题,只要写出来的东西能用就行。反正是大型计算机运行,怕球?
  凌晨两点钟,第一个函数构建完毕。这就是谢晋苦求不得的那个公式,可以用来提取数字信息的特征,归纳1和0的排列规律,整理成音频、音高、波形等不同的参数。
  楼清焰直接睡在了公司里,第二天早上起来,继续构建函数,一边写代码一边学习。
  他一直没看手机,也就不知道网上再次爆出的新闻。
  《楼清焰曾为佳辉担保贷款,无力承担破产后果》
  “据知情人披露,楼清焰曾为佳辉一笔贷款做担保人,佳辉经营不善,面临破产,一旦破产,巨额债务将转移到他个人头上。楼清焰很可能无力承担此后果。”
  《遗嘱曝光前夕,楼清焰完成大规模财产变现,是否另有隐情?》
  “xx网获悉近日消息,在初一车祸至初九遗嘱曝光这段时间里,楼清焰大量变卖名下的非现金资产,几乎全部换成现金。据调查,完成变现后,他仅是将这笔钱存入银行,并无其余动作。”
  “相关人士认为,这种超乎寻常的举动,可能是因为提前获知了佳辉的财务状况,以备不时之需。网络也有传言,认为楼清焰赌博欠下巨额债务,已无力偿还。”
  “不管此举内因是什么,在父亲车祸瘫痪期间作出如此动作,是否显得急不可耐?是否说明父子关系早已破裂?全平台第一网红、国民富二代楼清焰,他的未来到底何去何从?”
  ……
  第二天又写了整整一天,才完成算法的主体,这段代码也具有了它的初步功能:分析声音样本,生成一个名副其实的“电子声带”模型,并利用该模型发声。
  为了采集声音样本,楼清焰大晚上给楼皓宸打电话,拖着对方煲了两个小时电话粥。
  楼大元的声音样本,则从他过往的视频资料中提取。
  接着,占用佳辉官网服务器的资源,利用大型计算机进行快速运算,很快就建起这两人的的电子声带模型。
  他对着电脑,缓缓敲下一行字。
  电子声带开始飞速运算,十分钟后,输出声音。
  “楼大元”开口说话了。
  “对,老子就是个强jian犯!那你又算什么?老子强jian生下来的孽种?”
  楼清焰冷静地分析:流畅度是有的,自然度不太够,语调起伏、语义表达都有欠缺,需要在后期软件里手调。另外,可能由于样本量太少,某几个字的发声略有失真,需要修改或者模糊处理。
  不过足够了,又不是要制作广播剧。
  他一点点把这句话调整到了最佳状态。
  下一步,看看波形分析,能不能和原音对起来。
  望着屏幕上两条近乎重合的曲线,楼清焰发出了一声反派的叹息。
  “我也不想的,真的是你逼我的……”
  *
  离开公司时又是凌晨时分。
  合成语音已经构建得差不多,还剩后期调整的工作,很快就能完成。
  楼清焰也终于看到网上爆出的消息,不过他只是扫了一眼,就满不在乎地刷过去了。楼大元这么虎视眈眈,消息不曝才不正常。
  不管怎么样,丑闻已经酿成,元辉需要尽力挽回声誉,方式自然是通过抹黑他。
  可以预见,接下来会爆发一系列有关他的丑闻,将人们对他的同情压下去,唤醒以前那股疯狂黑他的潮流。
  事件发展到顶端,很有可能会曝出许佳辉遗产的事。楼大元把遗产还给他,不仅仅是迫于法律不得不还,还为了找一个洗白的借口:看,我也不是一点都没给他。
  想到这里,他又发出了一声反派的叹息。
  “为什么要惹我呢,我真的不是好人呐。”

返回首页
返回首页
来顶一下
加入收藏
加入收藏
推荐资讯
栏目更新
栏目热门