百科问答小站 logo
百科问答小站 font logo



为什么相比于计算机视觉(cv),自然语言处理(nlp)领域的发展要缓慢? 第1页

  

user avatar   thomas-ender 网友的相关建议: 
      

进化已经证明了,语言的门槛确实比视觉高得多。

世界上有多少种生物长眼睛,并且具备视觉识别能力?

无数种。

5亿年前的三叶虫都有眼睛。人类的眼睛结构比三叶虫精细得多,但光学上并没有什么本质区别。

5亿年间,各种不同形态的眼睛至少独立进化了50~100次。当然,长眼睛的生物必然有视觉识别能力,否则它要这两根铁棒有何用?

最简单的例子:苍蝇蚊子都有视觉识别能力,能自动避障,否则打个蚊子也不会这么难。

苍蝇蚊子的大脑只有20万神经元,人脑有800~1000亿个。细思极恐,20万神经元就可以完美实现自动追踪、自动避障,蚊子会坐电梯上20层,再从客厅追到卧室,一巴掌呼过去居然还会躲。

如果自动驾驶能达到苍蝇蚊子的智能,人会大呼卧槽,然后shut up and take my money。你见过哪只蚊子飞着飞着一头撞死在墙上,或者两只苍蝇为了抢屎在空中追尾吗?

CV最早的case好像是谷歌做的猫狗分类器,据说用了16000个处理器,内含10亿个节点。效果好得来,让当时的人大呼卧槽。

不过,这个级别的视觉识别能力,任何一只猫或一只狗都可以,连老鼠都可以。

可想而知,视觉的门槛有多低。

但是我们问:世界上有多少种生物会说话?

那基本上只有人类一种。

之所以说“基本”而非“绝对”,是因为有少数情况还不确定。比如黑猩猩可以用眼神+简单的手势交流,有人认为可以算“前语言”。还有人认为海豚可以用超声波对话,具体在说什么,到现在也没研究出来。

但是无论如何,所有人都公认:像人类这么复杂的语言,这个星球上没有第二个。

如果把500万年前作为人类进化的起点,那么人类学会直立行走大约用了200万年,学会使用工具用了250万年,学会用火用了400万年,学会说话用了480万年。

是的,仅仅20万年前,人类7号染色体上的“语法基因”FOXP2才刚刚突变出来。

即使有了500万年修炼而成的语言天赋加持,人类也不是一出生就会说话的。很多人学到20多岁,一门外语还学不明白,用母语写个800字的小作文都叫苦连天。

从商业角度,如果一辆车有了蚊子的视觉识别能力,肯定会有不怕死的想买来试试;如果摄像头有了一条狗的视觉识别能力,肯定会有人想买来看家护院。

但如果一个nlp AI有了10岁小孩的语言能力,除了拿100个诺奖,它好像也没有什么了不起的商业价值,连当个淘宝客服都会被买家差评。

因为nlp对标的是人,一个进化了500万年的人,一个成年人,一个有智商、有情商、有常识、最好还会多门外语的成年人,一个能区分“你这个睿智”和“你是一个睿智的人”的成年人。

大自然炼了500万年丹才勉强做到,每个人上了20年学才勉强做到,你一个搞nlp的发一篇文章就想取代人类?

nlp发展缓慢才是正常的,如果语言智能的门槛和视觉一样低,你现在不仅要学英语,可能还要学喵星语、汪星语、鸟语,上个厕所都得先跟苍蝇谈好价格。

但令人大呼卧槽的是,明明门槛这么高,nlp居然还是做出了有商业价值、让很多人能真正用得上的产品:

机器翻译。

很多人以为机器翻译肯定既懂中文、也懂英文,否则它怎么可能翻译出来?

但实际上,机器既不懂中文、也不懂英文,它只懂两种token之间的转换关系。在AI看来,它每天干的事情可能就像对对联:

上联:上海自来水来自海上
下联:Able was I ere I saw Elba

在无止境地堆算力、堆数据之后,AI竟然硬是走出了一条路,现在翻译诺贝尔文学奖的作品还不敢,但是翻译个论文资料已经完全可读了。

我最近就做了一个能直接翻译英文pdf的工具,不是划词翻译那种,而是一次性翻译整个文件,英文pdf进,中文pdf出。这样看论文就可以偷懒了~

链接如下,感兴趣的同学可以试试。目前只有PC版,APP的坑一直没填:

效果:

距离完美还很远,还有巨量的坑要填。但是至少不影响阅读,至少大多数用户觉得已经可以正经用了。

至于未来nlp的发展,我认为一种可能是达到“技术奇点”后,AI进入自我进化。也就是说,用AI训练出下一代AI,最终以人类无法理解的方式实现和人类语言能力匹敌的人工智能,甚至实现强人工智能。

另一种可能,就是继续堆料,继续缓慢发展,虽然这个“缓慢”相比其它行业简直就是闪电。


user avatar   wddddds 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   xpqiu 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   inprobabilitywetrust 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   teng-gu-38 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   johnzhang1999 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   huo-hua-de-41 网友的相关建议: 
      

不请自来,关于Mac的使用,一周进步的编辑部一直以来都有自己的心得。很多人似乎都对MacOS存在误解,尤其是刚从Windows过来的朋友会极度不适应,但其实MacOS也有许多便人之处,只要你学会有正确的方式去使用它。


回答目录

1.系统辅助:Haptic Touch Bar、Alfred、manico、Mounty、NTFS、Dr.cleaner

2.效率办公:幕布、eagle、Paralles Desktop、WPS、XMindZEN、钉钉、Folx

3.影音播放:VLC、Camtasia、ScreenFlow、暴雪客户端、Mach Desktop


1.1.Haptic Touch Bar

Haptic Touch Bar是MacOS下一款能调节Touch Bar的声音、振动反馈幅度的软件,让你在使用Touch Bar的时候体验感更强,有一种好像在使用实体按键的错觉。(Tips:请在2016款或以上带有TouchBar功能的MacBook使用)

Haptic Touch Bar

1.2.Alfred

几乎是Mac必装的软件之一。它可以帮助你快速查找电脑文件、启动软件,你还可以用Alfred设置一些常用的Workflow,从而快速完成许多复杂的工作。比如:百度搜索、Google搜索、转换链接为二维码等。

1.3.manico

众所周知Mac打开多窗口后切换十分不方便,一个个点选缩小效率非常低。使用manico后可以获得像Windows一样的Tab栏,只需要使用快捷键commod+tab就可以在不同窗口间快速切换,速度非常快。

1.4.Mounty

很多刚接触Mac的用户经常都会有这样的疑惑:为什么我的硬盘无法读取?这是因为一般出厂默认的硬盘是NTFS格式,而Mac不支持这种格式,你需要安装相应的第三方软件,比如:Mounty、NTFS For Mac后,才能正常读取硬盘或者U盘。

除此外,还有一种操作是在Windows电脑中将硬盘格式化,然后修改格式为exfat,这样再在Mac中就能正常使用了。

1.5.Dr.cleaner

使用Mac几乎不需要杀毒软件,但同样需要一款清理软件。Dr.Cleaner就是一款免费但却非常好用清理工具,还能实时监测电脑的运行情况,非常方便。一般来说,免费版提供的功能就已足够使用,如果有深度清理的需求可以购买Pro版。



2.1.幕布

幕布是一款非常好用的思维导图工具。但它却和普通的思维导图工具不同,可以采用大纲的模式去记录笔记,同时可以转换成思维导图,而且还拥有Windows、Mac、微信公众号、网页端等多平台,同步速度也非常快。办公利器,值得推荐。

2.2.XMindZEN

说起思维导图自然少不了Xmind,但与传统的Xmind系列不同,新推出的ZEN系列非常轻便、好用。界面UI等也非常赏心悦目,使用起来有一种沉浸感,非常爽。

2.3.Paralles Desktop

有的时候我们难免逃脱不了需要使用Windows电脑进行办公,很多朋友也会选择在Mac里安装一个虚拟机以备不时之需。安装虚拟机推荐使用Parplles Desktop,安装起来非常简单,使用也非常舒适。

2.4.eagle

eagle是一款图片管理软件,如果你是一名设计师经常管理大量图片,强烈推荐使用。使用eagle你可以对Mac上的所有图片进行统一的管理,直接拖拽到PS等也非常方便,而且eagle也有Windows客户端。

2.5.WPS

WPS For Mac其实也是非常不错的工具,Office For Mac时常会出现许多bug或者卡顿的现象出现,非常影响效率。如果你的需求只是阅读和查看Office文档,可以考虑安装WPS。

2.6.钉钉

钉钉现在是企业办公市场第一,很多公司都会采用钉钉才进行办公协作,但其实作为个人用户同样可以使用。与QQ不同,钉钉不会限制登录的设备及数量,所以你可以在你任意的设备上登录钉钉,传文件起来就非常方便。

2.7.Folx

迅雷在目前来说,还是最方便的下载工具之一。但它的问题在于许多热门资源很容易失效或者限制下载,这时候往往我们替换一个磁力链接下载工具, 比如:Flox就可以了。



3.1.VLC

Mac上的播放器有很多,一般情况下quicktime就已经足够使用,但还是会遇到一些格式的文件无法打开,这时强烈推荐VLC,支持格式非常广泛而且还支持字幕导入。

3.2.Camtasia

Camtasia是一款非常好用的录屏软件,在Windows下同样也有,不过在Mac没有汉化。之所以说它强大是因为它不仅能完成视频录制,还能做后期剪辑、音频美化、字幕导入等功能,相当于简易的Premiere了。

3.3.Screen Flow

Mac下最为人广泛使用的录屏软件之一,相比Camtasia它对Mac的优化更好,使用起来也更人性化。

3.4.Mach Desktop

可以用高清Gif或者视频来作为电脑的背景,相当于Windows中Steam的wallpaper engine,只要找到高清的资源后,你的桌面就会非常炫酷。但同样这个软件非常消耗内存和电量,酌情使用。

3.5.暴雪游戏客户端

如果你想在Mac里玩游戏...那暴雪游戏客户端值得推荐,目前暴雪除了守望先锋外,所有游戏都有Mac版本。当然Steam也有很多适合Mac的游戏,也非常不错。

最后,说起MacOS常用的软件,大名鼎鼎的Adobe全家桶怎么能少呢?

关于MacOS软件就回答到这里,想了解更多关于办公、职场、效率的知识就关注我们吧。


更多阅读

Mac上有哪些冷门但逆天软件? (推荐)

还用Mac装win?你就out了。 (推荐)


一周进步〡年轻人快速突破自己的学习入口
微信公众号:关注「一周进步」(weekweekup)
青年兴趣课堂,每周一场训练营,欢迎关注,让我们一起进步
更多干货欢迎阅读:一周进步文章精选



  

相关话题

  学习人工智能,术语看不懂怎么办? 
  如何通俗易懂地讲解 Photoshop 中的「通道」概念? 
  如何通俗的解释交叉熵与相对熵? 
  国内有哪些不错的CV(计算机视觉)团队? 
  深度学习领域,你心目中 idea 最惊艳的论文是哪篇? 
  计算机视觉中,目前有哪些经典的目标跟踪算法? 
  如何看待比 iPad 还大的史上最大芯片问世? 功耗比电磁炉还高有什么用? 
  12个人工智能机器人一直玩狼人杀,会出现什么情况? 
  什么是主动学习(Active Learning, AL)? 
  在NLP上,CNN、RNN(认为LSTM等变体也是RNN)、最简单全连结MLP,三者相比,各有何优劣? 

前一个讨论
西班牙拉帕尔马岛火山附近农民采摘香蕉满脸火山灰,他们在这种空气质量下会诱发什么疾病?
下一个讨论
中演协将吴亦凡、郑爽、张哲瀚等 88 人列入警示名单,你有什么想说的?还有哪些信息值得关注?





© 2024-11-08 - tinynew.org. All Rights Reserved.
© 2024-11-08 - tinynew.org. 保留所有权利