注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

在路上...

点滴感悟,成长记录...

 
 
 

日志

 
 

【Reading】刘未鹏的走出肖申克系列摘抄之二  

2011-12-16 20:22:15|  分类: Reading |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

从视觉错觉到偏见一文。。。

刘的文章中说到,对于一张二维图片,人眼可以看出三维的效果,其本质原因是加入了一些先验假设,先验假设的作用就是帮助大脑消解二义性。而先验假设则是偏见的本质来源。比如凹凸按钮的例子,是因为加入了“光线来自上方”的先验假设,而对于卓别林的面具的例子,则是“光线来自上方”的先验假设和“脸是凸曲面”的先验假设之间的较量。。。事实证明,大脑的逻辑是这样的:如果假设光照来自上方,那么根据阴影来推断这就应该是一张凹陷的脸。但我们又知道所有的脸都是凸的,因此必须推翻光线来自上方的假定才能符合“事实”——当大脑中的两个假设相冲突的时候,更强硬的那个获胜。如果这不是一张人脸面具,我们便可以轻易地意识到是凹陷的了。所谓的更强硬的那个先验假设,也就是我们长期进化形成的,最难以改变,最容易第一时间触发的那个先验假设,而它们,也就是我们偏见的根源。。。

“看你是左脑还是右脑”的“旋转的女人”的例子也是这个道理,因为我们对于顺时针旋转这个先验假设更加熟悉。。

其实,说到底一张二维图片就是一张二维图片(外界物体反射的光线投射到我们的视网膜上也只是留下二维的剪影),其三维解释有N种(甚至无数种),但为什么绝大多数情况下我们的大脑能够一下就锁定在其中的一种可能性解释上呢?皆因我们的大脑对生成这张图片(特别是图片中的阴影)的环境参数有一些先验的假设(如前面提到的“光照来自上方”、“脸是凸曲面——严格来说,鼻子是凸的”)(注意,这些先验假设并不蕴含在图片中,而是我们在长期生活中无意识统计出来的,或者干脆就是漫长的进化过程筛选出来的有价值的先验假设——正如婴儿天生在吃奶期就懂得吮吸一样。)

除了以上例子以为,还有色彩恒常性、“旋转彩柱错觉”等等视觉错觉现象。。。

以上这些错觉现象实质上揭示了一个深刻的原理,这个原理不仅适用于视觉现象,同样适用于其他心理现象:我们的大脑从外界接受到的信息其实是满含着歧义的,单单从这些信息本身来看,我们应该感到无所适从才是,然而我们的大脑几乎每次都能够从富含歧义的信息中找出最靠谱的解释,作出无比牛B的点估计,这得益于漫长的进化过程,以及我们平常生活中积累的大量先验假设,然而,接下来我们要说到,这些先验假设是双刃剑,其锋刃的另一面就是我们常说的“偏见”。

对于日常生活中的事件,总有一个平凡的解释,和一个疯狂的解释。
 
我们总是混淆“事实”和“推断”,尤其是当我们对推断的确信度很高的时候,或者某种推断对我们有利的时候,或者当这个推断源于大脑天生的偏见的时候,例如,将关联误当做因果就是我们的认知死穴之一。
 

我们太可能因为受到知识的局限性而对事物的看法产生无法消除的偏见,有时候打破这种偏见的唯一途径就是开阔视野,多积累知识,以及和具有不同知识背景的人讨论,否则就算抱着“我可能是错的”这种信念,你也不知道怎么去证伪自己的一个猜测。

 

关于虚假记忆的研究也表明,我们的记忆并不像电脑的存储设施那样,忠实记录,然后忠实读取,而是在记录和读取的时候都是相当程度上“构建性”的,而构建所用的“素材”则是我们之前在生活中积累出来的经验。这也是为什么同一个故事经不同的人口口相传之后会出现形形色色的版本的原因。

 

对基于统计(特别地,基于贝叶斯)的垃圾邮件过滤的基本机制有所了解的同学应当知道,在判别公式里面有两项分别是P(S)和P(H),分别代表一封邮件是垃圾邮件和非垃圾邮件的(先验)概率,一项统计表明现实世界中这个比例是8/2,即80%的邮件是垃圾邮件。这个就是过滤器眼中的世界,“八成的人都是坏人”,这个就是过滤器的“偏见”,或者“先验假设”,来一封邮件不管三七二十一首先作一个最坏的打算。正如机器学习方法的偏见来源于训练数据集,我们头脑中的偏见也来源于我们大脑中神经网络的训练数据集——现实生活

由于8/2的比例并非时间无关的稳定比例,或者其他什么原因(如保守起见),目前大多数贝叶斯垃圾过滤系统实际上将这个比例设为5/5,表示“无偏见”,不设先验。这就基本上将贝叶斯这个词扔掉了。但我个人觉得这并不能称为“无偏见”,如果现实就是“有偏”的,保持公平也是一种偏见,这让我忍不住想起P. Norvig讲的关于人工智能鼻祖Minsky的一则轶事

 

如果现实世界背后的模型本来就是“有偏”的,假装不引入“偏见”本身就是“偏见”。只不过我们所观察到的现实世界纷繁的表象往往只是一个局部有偏样本,导致我们看上去随机抽取的数据其实还是有偏的,如果我们蒙上眼睛骗自己说这就是真正随机的抽样,那么训练出来的模型肯定也是有偏的,为了补偿这种偏差我们有时候宁可扔掉从训练数据中得到的某些概率,这种方法往往导致长期来讲更靠谱(严格来说这里的术语是robust)的模型,尤其是在金融市场上,小聪明的人从短期趋势数据上自以为得到了靠谱的模型,把太多的赌注放在了一个建立在因在时间维度上没有随机采样而很可能有偏的数据集上得到的模型上,而真正智慧的玩家则会建议普通人最佳投资方法是无偏见地平均分配资金,避免因模型错误而导致的灾难,这一平均分配的极端形式就是——投资指数。

 

偏见在我们解决问题、认识世界的过程中都起到了很大的影响,并且很多时候是不好的影响。因此,让我们经常和具有不同信念和知识背景的人讨论,弥补个人经验知识的局限性导致的偏差,并时常使用以下这句话来提醒自己keep an open mind吧:

“这只是一种解释(可能),未必是唯一的解释(可能)。(想不出其他解释不代表就不存在其他解释)。”








  评论这张
 
阅读(112)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017