开栏寄语
为提升本院各项工作水平,广纳各界精英对法院各项工作的有益见解,活跃司法调研氛围,特于今日开设本栏。北井,巫溪古之称谓,亦为盐场旧称;鹿者,为盐泉神鹿;且《诗经》有《小雅·鹿鸣》一诗,其主旨颇有争论,或曰美诗或曰剌诗,本身即为值得调查研究与讨论的代表,与本栏开设目的相符。开栏之初,倍感任重道远,幸蒙市高法院研究室海明副书记不吝赐佳作《司法调研应突破“舒适区”》一文为本栏头作,倍感鼓舞。亦借此诚邀佳文!
作者简介
薛海明,重庆市高级人民法院研究室副书记,专职党务干部。主要从事司法调研、 司法改革等工作。
司法调研应突破“舒适区”
读《学习究竟是什么》一书,其中介绍的学习方法颇有启发,结合司法调研工作,谈一点个人的感受。
一、舒适区、学习区与恐慌区
“舒适区”算是一个心理学上的概念,近年来在各个领域都被广泛使用。与之相关的还有学习区与恐慌区两个概念。如图所示:
从学习的角度来说,舒适区里的内容太容易,恐慌区里的内容又太难,学习区难度恰到好处。要想提高水平,就必须在学习区不断向前推进。从工作的角度来说,如果工作的挑战大大低于自己的技能,就会觉得工作十分无聊。如果工作的挑战大大超出自己的技能,会感到十分焦虑。而如果难度和自己的技能较为匹配,一上手时不知道如何做,但调动自己最高水平的技能,再稍微突破一点,就正好能解决这一问题。做过数学题的都由这种感受,经过深入思考后终于得出答案后,会有一种心流的体验。作者在书中还专门提到了文艺创作方法,从文艺创作的角度来看,不能让观众看了开头就能猜到结尾,没有丝毫悬念。“喜欢=熟悉+意外”,一个文艺作品要想最大限度地吸引观众,必须既提供观众熟悉的东西,又能够制造观众想不到的意外。
以上三个角度,共同探讨的是已知和未知、简单和困难、熟悉和意外的合理搭配。从信息论的角度看,是“旧信息”和“新信息”的配比问题。
二、最优学习的 85% 规则
舒适区、学习区、恐慌区三个概念虽然流行,但都是泛泛而谈,没有进行量化。看起来似乎像鸡汤,但其实大有深意。一篇发表在《自然通讯》上的论文“The Eighty Five Percent Rule for optimal learning”,详细介绍了最优学习的 85% 规则,论文作者检验了算法训练中训练难度这一单一变量对学习率的影响,通过理论推导和模拟实验,发现对于所有基于随机梯度的学习算法而言,训练的最优误差率约为 15.87%,反过来说,最优训练准确率约为 85%。研究证明,“85% 规则”对人工神经网络和模拟生物大脑的神经网络的效用是一致的,可以用来描述动物学习。
这是什么意思呢?理解这一结论,需要一点大数据和人工智能的基础知识。
人工智能的本质是机器学习,具体操作方式是设计一个多层神经网络,然后使用大量的数据训练这个网络,最终让网络学会自己作出准确的判断。网络内部有大量参数随着训练不断变化。每一次训练,都是先让网络对数据作一个自己的判断,然后数据再给网络一个及时的反馈。如果网络判断正确,就会加深巩固网络中现有的参数设置。如果判断错误,就会调整参数。不论是图像识别、语义理解还是智能推送,都需要算法训练的结果。研究者可以决定用什么难度的数据去“喂”这个网络。如果数据难度太低,网络每次都能猜对,那显然无法提高判断水平。如果数据难度太高,网络总是猜错,那它的参数就会无所适从。
如前所述,这篇论文研究问的问题是,每次训练中网络判断的错误率是多少才是最优的训练?根据研究,当对人工智能算法进行数据训练时,输入的数据应当有84.13%是算法熟悉的,有15.87%是它感到意外的,15.87%的意外率能让训练时间相对于其他数值的意外率以指数下降。如下图所示(图片来源于网络):
该结论“对人工神经网络和模拟生物大脑的神经网络的效用一致,可以用来描述动物学习”。推而广之,15.87%不但是学习中的最佳训练出错率,还可以是电子游戏中的玩家最佳犯错率,也可以是文艺作品中的最佳意外率。这一研究真正体现了实证研究的精神,将一个鸡汤式的说法变成了一个科学的结论。对于从事司法调研、学术研究者而言,也应当追求“85% 规则”的效果,突破“舒适区”,实现高质量产出。
三、“85% 规则”的应用:
“85% 规则”在司法调研、学术研究中的应用,虽然没必要如算法训练、电子游戏设计等领域那般精确,实际操作中也不可能精确实现,但这一思想、这一具体的量化方法仍然非常具有指导意义。
首先,要熟悉已有的研究成果,掌握已有的文献。司法调研、学术研究是一个“理解他人、表达自己”的过程。不应从零开始、从打地基开始,不应另起炉灶,而应该在一个学术共同体内部,在别人研究的基础上往前推进。绝大多数的时候,前人都已在相关问题上已经做了一定程度的积累,一定要有一个自觉的学术传统意识,从已有研究成果为基础,站在学术研究最前沿往前逐渐突破,这就是牛顿“站在巨人的肩上”的意思。即使伟大如牛顿,其成就也是在总结之前很多伟大科学家如哥白尼、伽利略、开普勒的杰出成果基础上形成的,没有之前那些科学家所做的学术积累,牛顿也不会取得成功。特别是社会科学研究,可以说在当前任何人的研究都不会是亘古未有的。已有的研究成果,应当是研究者的“舒适区”。
其次,要有自己的创新。没有创新,在已有研究成果内部打转,东拼西凑,就是待在舒适区不愿出来,不会有任何学术价值,最多只能算是一位学习爱好者。创新的基本要求是要有问题意识,问题是开始研究的导火索。司法调研不应从概念出发,论文不宜写成典型的教科书风格,因为两者的受众群体完全不一样。教科书的基本功能在于介绍基本知识,面对的是零基础的读者,需要面面俱到地介绍某一主题地所有方面。而学术论文不是写给刚入行的读者看的,其价值不在于传授基础知识,而是用于学术共同体内部的交流,是写给同行看的。同行,就是跟你具有大致相同知识背景的人,不宜假定同行连基本概念都没搞清楚,需要自己从基本概念面面俱到地讲起,常识性的、通说性的内容不应出现在一篇论文当中。论文应围绕问题展开。只有围绕问题展开,才能清楚需要通过什么样的角度、什么样的线索去组织什么材料,没有问题意识,面对堆积如山的资料会无所适从。至于问题从哪里来?如何确定研究主题,限于篇幅不再展开。有了问题意识并围绕问题进行思考,就进入了“学习区”。
最后,学习和研究应当循序渐进。司法调研、学术研究是一个舒适区、学习区、恐慌区三者边界不断外扩的过程,也是一个人水平不断提升的过程。通过在学习区的不断思考,自己的舒适区会越来越宽,以前觉得是恐慌区的内容,也会逐渐不再恐慌。在没有积累的情况下,不要贸然进入完全陌生的领域,不应一开始就挑战高难度的内容,一头扎进恐慌区。具体如何操作呢?一是应阅读有知识增量的文献,其中知识增量应大致符合“85%的熟悉+15%的陌生”的组合,这样的组合可以让学习速度更快,也能让研究者感受最好。熟悉的内容太多,收获不大。陌生的内容太多,过于吃力。二是研究成果也应大致符合“85%的熟悉+15%的陌生”的组合,学术创新内容不宜过少,否则没有学术价值,还会有抄袭的嫌疑。当然,社会科学研究成果,不可能通篇都是创新内容,能达到15%的有价值的原创内容,已实属不易。最重要的是,这样的研究成果,对读者最友好。