第670页

  • 关于圆的定义

    关于圆的定义

    昨天,我读到一篇文章,很赞同它的观点。 作者举了一个圆的例子,来说明这一点。 圆形可能是人类最先认识的形状。我们从直观的体验,就可以马上说出,什么是圆的。比如,苹果是圆的,轮子是圆的,太阳是圆的,等等。 但是,如果要从学术的角度,严密地定义圆,就不是那么简单了。原作者举出了5种定义,可以看到,随着定义越来越严密,圆形的概念也变得越来越抽象。 =============== 定义一:圆是最对称的2维平面图形。 通过中心的任意一条直线,都可以将圆形分成完全相等的二部分。 定义二:在相同周长的情况下,...

    期权知识 2020-08-18 566 0
  • 数学常数e的含义

    数学常数e的含义

    1. e是一个重要的常数,但是我一直不知道,它的真正含义是什么。 它不像π。大家都知道,π代表了圆的周长与直径之比3.14159,可是如果我问你,e代表了什么。你能回答吗? 维基百科说: "e是自然对数的底数。" 但是,你去看"自然对数",得到的解释却是: "自然对数是以e为底的对数函数,e是一个无理数,约等于2.718281828。" 这就构成了循环定义,完全没有说e是什么。数学家选择这样一个无理数作为底数,还号称这种对数很"自然",这难道不是很奇怪的事情吗? 2. 昨天我读到一篇好文章,...

    期权知识 2020-08-18 545 0
  • 相似图片搜索的原理

    相似图片搜索的原理

    上个月,Google把"相似图片搜索"正式放上了首页。 你可以用一张图片,搜索互联网上所有与它相似的图片。点击搜索框中照相机的图标。 一个对话框会出现。 你输入网片的网址,或者直接上传图片,Google就会找出与其相似的图片。下面这张图片是美国女演员Alyson Hannigan。 上传后,Google返回如下结果: 类似的"相似图片搜索引擎"还有不少,TinEye甚至可以找出照片的拍摄背景。 ============================================...

    期权知识 2020-08-18 547 0
  • 贝叶斯推断及其互联网应用(一):定理简介

    贝叶斯推断及其互联网应用(一):定理简介

    一年前的这个时候,我正在翻译Paul Graham的《黑客与画家》。 那本书的第八章,写了一个非常具体的技术问题----如何使用贝叶斯推断过滤垃圾邮件(英文版)。 我没完全看懂那一章。当时是硬着头皮,按照字面意思把它译出来的。虽然译文质量还可以,但是心里很不舒服,下决心一定要搞懂它。 一年过去了,我读了一些概率论文献,逐渐发现贝叶斯推断并不难。原理的部分相当容易理解,不需要用到高等数学。 下面就是我的学习笔记。需要声明的是,我并不是这方面的专家,数学其实是我的弱项。欢迎大家提出宝贵意见,让我们共同学习和提...

    期权知识 2020-08-18 496 0
  • 贝叶斯推断及其互联网应用(二):过滤垃圾邮件

    贝叶斯推断及其互联网应用(二):过滤垃圾邮件

    上一次,我介绍了贝叶斯推断的原理,今天讲如何将它用于垃圾邮件过滤。 ======================================== 贝叶斯推断及其互联网应用 作者:期权记 (接上文) 七、什么是贝叶斯过滤器? 垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。 正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。它们的识别效果都不理想,而且很容易规...

    期权知识 2020-08-18 608 0
  • 骰子作画的算法

    骰子作画的算法

    程序员Scott MacDonald做了一个很有趣的项目----骰子作画。 他用黑底白点的骰子。 模拟出一张人像照片。 把图像放大,就可以看得更清楚。 他一共用了2500多颗骰子。 最后的成品就是这样。 任何一张图片都可以用骰子模拟出来,算法非常简单:将图片分成若干个区域,每个区域经过计算以后,用1-6之间的一个整数表示,代表骰子的一个面。这种将连续的量转化成不连续的整数的算法,属于vector quantization(矢量量化)的一个应用。 具体来说, 第一步,将图片分割成...

    期权知识 2020-08-18 526 0
  • 基于用户投票的排名算法(一):Delicious和Hacker News

    基于用户投票的排名算法(一):Delicious和Hacker News

    互联网的出现,意味着"信息大爆炸"。 用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。 各种各样的排名算法,是目前过滤信息的主要手段之一。对信息进行排名,意味着将信息按照重要性依次排列,并且及时进行更新。排列的依据,可以基于信息本身的特征,也可以基于用户的投票,即让用户决定,什么样的信息可以排在第一位。 下面,我将整理和分析一些基于用户投票的排名算法,打算分成六个部分连载,今天是第一篇。 一、Delicious 最直觉、最简单的算法...

    期权知识 2020-08-18 508 0
  • 基于用户投票的排名算法(二):Reddit

    基于用户投票的排名算法(二):Reddit

    (不好意思,这个系列中断了近两周,我会尽快在这几天,把后面几篇写完。) 上一次,我介绍了Hacker News的排名算法。它的特点是用户只能投赞成票,但是很多网站还允许用户投反对票。就是说,除了好评以外,你还可以给某篇文章差评。 Reddit是美国最大的网上社区,它的每个帖子前面都有向上和向下的箭头,分别表示"赞成"和"反对"。用户点击进行投票,Reddit根据投票结果,计算出最新的"热点文章排行榜"。 怎样才能将赞成票和反对票结合起来,计算出一段时间内最受欢迎的文章呢?如果文章A有100张赞成票、5张...

    期权知识 2020-08-18 677 0
  • 基于用户投票的排名算法(三):Stack Overflow

    基于用户投票的排名算法(三):Stack Overflow

    上一篇文章,我介绍了Reddit的排名算法。 它的特点是,用户可以投赞成票,也可以投反对票。也就是说,除了时间因素以外,只要考虑两个变量就够了。 但是,还有一些特定用途的网站,必须考虑更多的因素。世界排名第一的程序员问答社区Stack Overflow,就是这样一个网站。 你在上面提出各种关于编程的问题,等待别人回答。访问者可以对你的问题进行投票(赞成票或反对票),表示这个问题是不是有价值。 一旦有人回答了你的问题,其他人也可以对这个回答投票(赞成票或反对票)。 排名算法的作用是,找出某段时...

    期权知识 2020-08-18 546 0
  • 基于用户投票的排名算法(四):牛顿冷却定律

    基于用户投票的排名算法(四):牛顿冷却定律

    这个系列的前三篇,介绍了Hacker News,Reddit和Stack Overflow的排名算法。 今天,讨论一个更一般的数学模型。 这个系列的每篇文章,都是可以分开读的。但是,为了保证所有人都在同一页上,我再说一下,到目前为止,我们用不同方法,企图解决的都是同一个问题:根据用户的投票,决定最近一段时间内的"热文排名"。 你可能会觉得,这是一个全新的课题,伴随着互联网而产生,需要全新的方法来解决。但是,实际上不是。我们可以把"热文排名"想象成一个"自然冷却"的过程:   (1)任一时刻,网站中所有的文...

    期权知识 2020-08-18 536 0