math-in-life

心中有数

心中有数,生活中的数学思维:https://book.douban.com/subject/35749693/

人生是一个找最优解的过程。开始时谁都不完美,但我们可以提升自己,目标是达到可能到达的最优位置。

主动预测,从差距中学习

主动预测,从差距中学习:读问题,猜答案,找差距,写心得
看到了这个论文要解决的问题之后,立刻把论文扔在一边;然后开始思考这个问题,并拿出一张白纸把自己的解决方案、推导过程写下来。最后,他把自己的答案和文章中给出的方案进行比较,从而获得灵感和启发。很多时候,他给出的方案甚至比手头的论文还要好,这时候他就把这个点子整理出来,投到会议和期刊上发表。
要想看书快,可以预测你手里这本书的下一页讲的是什么。一眼发现新的东西,抓住重点,知道这本书在这一领域内处于什么位置,做出了什么新贡献。

选本质

套用模型前,明确目标

  1. 选择√,这是本质
  2. 优化

设计电饭煲,使用“软磁铁在103℃左右失去磁性”,以及“水的沸点为100℃”的物理特性,显然要比设计的“温度传感器+重量传感器+单片机控制”的方案更简单、经济,无论单片机控制算法做的多么先进。
自动取票机避免乘客忘记拿身份证。放置身份证的位置设计成倾斜的,比图像和视频处理技术更好。图像和视频处理技术的设计与改进,需要在自动取票机上加装一个摄像头,读取摄像头的数据,用算法来识别取票的人是否把身份证忘在自动取票机上。这是基本的设计方案,在这个基础之上也可以优化具体的细节,例如提高图像处理算法的精度和实时性,提高算法的鲁棒性,等等,也可以提高实用性,例如当算法检测到一个人刚取完票离开但忘拿了身份证时,就立刻通过语音来提醒他。

抓本质,去杂质

若要在已有事物上创新,则抓本质,去杂质。
弄清事物产生作用的原理,知道哪些是关键因素,哪些是不必要的限制,然后把关键因素抽离出来,摆脱不必要的限制,就可以改进得更好。
在选取论文时,不一定要选择和自己的研究方向完全一致的论文。其次,在读他人的论文时,不仅要关注具体的技术细节,关注本质。找到本质,就可以摆脱他人论文中具体场景的限制,然后根据你当前研究的问题的特点,对这些思想和智慧进行改进,以此解决你的问题

多样性红利

“失之毫厘,谬以千里”,“多样性红利
直线方程 y=ax+b,自变量是a。a,b组成视角,y1是表象,x1是本质。两条直线夹角小。则只要直线斜率或截距发生小的变化,那么交点会产生极大变化。
如果多个人想通过交流的方式达成共识,了解某个事情背后的真相,那么这些人最好有不同的视角。一旦视角太接近,那么这些不同视角交叉得到的共识,会对噪声极为敏感。一点点噪声,都会对最后的结果产生极大的影响。所以,小组的集体讨论应充满争论和分析,则团队对外公布的结论往往是对的

条件独立则无关

如果事件A和事件B关于事件C条件独立,那么在知道事件C发生的前提下,知道事件A或事件B中的一个是否发生,并不能帮助我们更好地推断出另外一个事件发生的概率。
在“购买时间短B”这个事件发生的前提下,知道“购买香草冰激凌A”并不能帮助我们更好地推断“车启动不了C”的概率。
A 发生导致 B发生,B -> C
A,C 看似有关,实际关于另外一个事件B,条件独立。因此没有因果性
A代表激发事件(Activating event),B代表信念(Belief),C代表结果(Consequence)。
情绪ABC理论告诉我们,激发事件A是引发情绪和结果C的间接原因,而引起结果C的直接原因则是个体基于对激发事件A的认知和评价所产生的信念B。
同样是失恋了,有的人会开解自己,认为这未必不是一件好事;有的人却伤心欲绝,认为自己今生可能都不会去爱了。再比如,在找工作时面试失败后,有的人可能会认为这次面试只是一次尝试,不成功也没关系,下次再来;有的人则可能会想,自己精心准备了那么久,竟然没通过,是不是太笨了,别人会怎么评价自己。即使激发事件A一样,但这两类人的信念B不同,因此他们的情绪体验结果C也不同。
“人并不是被事物本身影响,而是被他们自己对事物的看法左右。”
很多情况下,两个事件看似相关,实则关于另外一个事件条件独立。如果我们不挖掘背后的“另外一个事件”,就很容易犯把“相关性”当成“因果性”的错误。

稀疏产生复杂

为什么随意试很难打开储物柜,那就是能够打开柜子的取件码,分布得太稀疏了。
任何一个连续的周期信号,都可以通过一组不同频率的正弦波叠加得出。这里的频率可以理解成变化的快慢,一条曲线变化得越快,频率越高。
把一个信号变成多个不同频率的正弦波的叠加,对我们有什么好处?因为这些正弦波是事先给定的,所以对于任意一个信号,我们只需要知道这些正弦波前面的系数a1,a2,就可以完全重现这个信号。简单地说,这些系数就是这个信号的另外一种表示。
如果用正弦波来表示,这些正弦波前面的系数大部分为零。也就是说,该信号的频域表示是稀疏的。
用不同频率的正弦波的叠加来表示原始信号
虽然原始图像看起来很丰富,也不稀疏,但是我们可以只用少数的简单图像表示它。
只需要把少量比较大的系数对应的简单图像和对应的系数一起存起来,就可以恢复原始图像。这大大压缩了存储需要的空间。
有一种“自组织”的算法可以很简单地重现鸟类的群体活动。
按照这种算法,鸟群中的每只鸟只要遵守如下三条规则飞行,就可以让鸟群整体展现出复杂的活动:
(1)避免与自身附近的其他成员碰撞;
(2)与附近其他成员的飞行方向大体保持一致;
(3)靠近其他鸟,不要落单。
飞行时,鸟群中的每只鸟只需获悉它周围局部的信息,根据这些信息与这三条规则采取相应的行动,整个鸟群就可以呈现出各种复杂的群体行为。
个体间的简单规则导致整体出现“高级”活动的现象在学术界中被称为“涌现”(emergence)。
稀疏在我们身边无处不在。很多看起来复杂的现象背后所包含的规律,是稀疏而简单的。

由主到次的增量式表达

事件本身>地点>时间

第一句话,应该要定基调,所以这个老师应该说“恭喜你”!
第二句话,应该补充一些细节,所以应该是“小明今天的表现太棒了”。
然后再补充细节。
“今天有一个小孩,过马路的时候不小心掉进马路旁边的沟里去了,小明跳进去救他,帮助那个孩子爬了出来,两个孩子都很安全。”

概率预测

预测方式可以是概率:“谋事在人,成事在天;平静接受现实,努力改变概率

如果你是研究生,你可能会把自己最近的工作写成一篇论文向一个很好的会议投稿。在录用通知出来前,谁也无法确定你的论文是否会被录用,因为有很多因素是你无法控制的,例如审稿人是否理解并欣赏论文的核心贡献,他看你论文时的心情,他同时评审的其他论文的水平,等等。
如果你这篇论文的核心贡献足够大,立意新颖,实验结果很好,文章的表达很清晰,那么这篇论文被录用的概率就会很高(例如有90%的概率被会议录用)。但是请记住,这仍然是一个概率,而不是一个确定的结果。
如果你的运气不好,这篇论文被拒绝了,请不要悲伤,你要做的应该是看一下审稿人的意见。如果某些意见是对的,那么你应该针对这些意见进行修改,提高下一次被录用的概率;如果经过分析你认为这些审稿人的意见并不客观,那么你应该直接把这篇文章投向另外一个会议。

提高概率

赌场的游戏是由赌场庄家设计的,在设计每一个赌局时,一定会在概率上让庄家比普通玩家更占一点优势,这个优势通常很小,为5%~10%,但不要小瞧,赌场最欢迎的,就是那些经常去玩的玩家,此外,赌场还会想方设法地增加投注次数。只要数量够大,庄家稳赚。因此“久赌必输”。
大数定律:只要一件事情发生的次数足够多,它出现某一个结果的频率就会等于其概率。
这个对概率的设定是革命性的。这意味着商家摆脱了“玩家的技术”这个桎梏,直接在概率的层面来和玩家玩这个游戏。
因此,

  1. 要努力提高你的基础概率。这一点非常明确。基础概率作为核心,是达成目标的关键因素。
  2. 如果你做成某件事的基础概率较大,那么重复的次数就是你最好的朋友,你需要尽量多次重复。

对于创业者来说也是如此。通常意义上,创业成功的概率很低,如果你本身的能力很强,又有资源,那么你创业成功的概率就会比平常人更高。假设你创业成功的概率达到了惊人的1/3,这并不意味着你创业3次就一定有1次能成功,大数定律告诉我们,只有你创业的次数达到一定值时,这个概率才能真实反映你的成功比例。当前社会,我们可以看到很多有能力但屡屡创业失败的人,请不要嘲笑他们的屡战屡败,虽然他们多次创业失败,但这并不意味着他们成功的概率低。这些人可以多尝试几次,让大数定律发挥作用。
3. 如果你的基础概率比你的竞争对手低,那么你应该进行如下思考。
先看看能不能提高基础概率,如果不能(例如你是赌场的玩家),对你来说,最佳方案是不参与赌博,跳到另外一个从概率上来说对你有利的局里。

模型预测

好的模型,提供预测能力,而不只是解释。

“科学方法”总结为以下五步:

如果结果符合你的预测,你的理论就有可能是对的;如果不符合,你就需要修正假设。看到了吗?科学方法强调的也是“预测”。我们可以用这一标准来检验生活中的各种理论。
你如果想判断某位股评家的水平,就只需要在一段时间内用他的理论预测股市。如果股市变化遵从他的理论,证明他是真的有水平。很可惜的是,绝大部分股评家都没有这个水平。不过在现实中,也很少有人认真统计这些股评家曾做的预测。
成功学理论本来就是从这些成功人士的身上总结出来的,所以可以很好地“解释”这些人为什么能成功。但是真正有用的成功学,应该能在很多人真正成功的前几年,准确预测到这些人可以成功。这样的成功学才是站得住脚的理论,也更有价值。

测试数据+变化规律,提高准确度

避免测试噪声,使用 测试数据+变化规律,根据根据信息的准确度,给予不同权重,使预测更准确。这是卡尔曼滤波器的核心思想,滤波指轨迹更平滑。
有时行书、草书等如果单看某个字我们可能不清楚写了些什么,但是连起来看整句或整篇,往往就可以正确地理解内容。这就是人们结合两种信息进行判断的结果。某个字本身的样子即我们对当前的观测,而我们可以基于此结合上下文,即状态的变化规律,猜出这个字的语义。

模型1:输入-系统-输出

如果输入是脉冲或刺激,则输出函数多是从零开始升高,在某一时刻达到最高点,而后逐渐下降(开口朝下的抛物线)。如果幸福感不会消退,我们就缺少东西去做事情如进食、让同伴钦佩、战胜对手、找到伴侣等
如果输入而会持续一段时间,那么此时系统的输出会是怎样的呢?把一个连续的输入,拆解成一系列脉冲序列后,我们只需要将系统在每个脉冲(冲激函数)单独作用下的输出加在一起,就能得到输出。卷积公式就是这个原理:系统对于一个脉冲序列的响应,就是其对单独每个脉冲输入的响应的叠加。
虽然大幸福每次产生的幸福感比小确幸高得多,但是这种幸福感维持的时间并不算长。更重要的是,因为间隔时间太久,所以你的幸福感仅在大幸福到来时很高,而在中间漫长的过程中,你的幸福感一直很低。
频繁的小确幸,能比偶尔的大幸福带来更多幸福感。这些小确幸就是生活中小小的幸运与快乐,只要你仔细观察、体会,永远都能发现它们。

模型2:稳定与跃迁:反馈

控制器:目标-策略
控制器:目标-策略
输入
输入
输出
输出
反馈
反馈
+输出
+输出
Text is not SVG - cannot display

你拿桌面上的手机。伸手-测量距离,缩短距离-准确抓住
反馈让系统具有了容错性和鲁棒性。运用反馈,你不需要精确的事先设计,只需要随时观察实际情况,并不断根据实际情况与目标的差距进行调整,就能达成目标。反馈不仅可以帮助一个系统实现事先设定的目标,当系统达成目标后,即使系统受到外界的干扰,反馈也可以帮助系统重新恢复稳定状态。
“输入”和“反馈”之间的差距决定了反应的大小。差距越大,反应就越大。负反馈=dist|输入-输出|,正反馈=dist|输入+输出|。
对于负反馈来说,差距就是驱动力。控制器对驱动力的策略多是PID(比例—积分—微分)控制。跑步圈数为例,

  1. 积分:上周每天66斤,则一周的累积差距是7公斤。本周第一天的跑步圈数=系数x累计差距=0.5×7=3.5(圈)。缺点,当前训练强度让体重增加,不应等到一段时间后,体重增加很多时改变运动量。
  2. 微分:按趋势及早改变运动量

坏的正反馈:破窗效应,一扇窗破了并得不到及时维修,别人会打碎更多窗户。
好的正反馈:提高产品生命力,构建生态。资源有限下,停止增长,趋于稳定。
一件事情有一个好的正反馈时,往往也有一个坏的正反馈,这中间只有一线之隔,结果却会天差地别。工作做得出色,会有越多机会。做事情时,敏锐找到好的正反馈,在初期坚持或借助外部力量,一旦飞轮转起来,好的结果自然水到渠成。

快速迭代,探索接受大概率的不完美,深耕

迭代:数值解法求函数极值。
数值解法劣势:陷入局部最高点而无法跳出,因为不能接受短期挫折,便无法换取一个更好的未来。年轻时多尝试工作,如创业。到一定年龄,在适合的地方深耕。
模拟退火算法:温度越高,随机性越强。退火表示随机性衰减,开始时充分探索,接受大概率的不完美,概率随时间降低
最小二乘估计找到的解,不力求让少数方程完全成立,而是让所有方程左右两边的误差之和最小,它背后体现出来的思想,是做事情不追求绝对完美,而是在接受不完美的前提下权衡多方利益,找到最佳平衡点。
有了一个初步可行的想法就开始写,写的时候不打磨语法,用最快的时间写出一个初稿。写完给周围的人看,让他们提意见,并且针对这些意见改进想法、用实验验证想法并且修改文章。这样经过多轮迭代完成对文章的打磨。

可控的弊,换取更大的利

CPU通用但慢,TPU只用于矩阵运算但快:一件事物乃至一个人都有其特点。因此最关键的是找到能够把特点变成长处的位置,让长处得以发挥,这样才能物尽其用,人尽其才。
主动用“可控的弊”,换取“更大的利”。如用启发算法,解决NP难问题(NP-hard problem),即找问题最优解需要的时间,随问题规模扩大而急剧增加,如找经过所有城市的最短路径。用弊(性能下降或距离变长)来换取利(速度快)。如果你可以接受某个启发式算法的弊,那么你就可以放心地用它解决实际生活中的问题。
兵书中有一个被称为“围城必阙”的心理战术,是指在攻城之时不将城池全部包围起来,而是打开一个缺口让敌人逃跑。因为如果敌军深陷重围,无处可跑,觉得没有活路,就必定会拼死抵抗,而放开缺口可能会放跑少数敌人,但带来的好处是瓦解敌人的士气,歼灭大部分敌人。这也属于主动用可控的弊,换取更大的利。

模型3:输入-变换-中间结果-逆向-目标结果

使用条件:直接操作原始形态代价太大,做个转换。
把散装货物放入集装箱(变换物体原始形态),然后通过货船将集装箱运到目的地(在变换后的形态上进行操作),上岸后把货物从集装箱里拿出来(逆向变换操作结果)。
收音机,使用选择电路筛选天空中不同频率的无线电波,使用LC谐振电路分离出人声,进入喇叭音圈,引起纸盆震动,听到声音

迁移学习

如果做算法工作

用新语言写程序,在实践中学习:先大致了解该语言的语法,然后在网上找到和任务功能相似的代码,开始读这个代码,并在此基础上编写、调试,遇到不懂的地方,直接去查该语言的语法。