快捷搜索:  汽车  科技

二分查找的算法分析(图解二分查找算法)

二分查找的算法分析(图解二分查找算法)你的目标是以最少的次数猜到这个数字。你每次猜测后,我会说小了、大了或对了。下面的示例说明了二分查找的工作原理。我随便想一个1~100的数字。这是一个查找问题,在前述所有情况下,都可使用同一种算法来解决问题,这种算法就是二分查找。二分查找是一种算法,其输入是一个有序的元素列表(必须有序的原因稍后解释)。如果要查找的元素包含在列表中,二分查找返回其位置;否则返回null。下图是一个例子。

算法是一组完成任务的指令。任何代码片段都可视为算法,下面我们要讨论二分查找,并演示算法如何能够提高代码的速度。在一个示例中,算法将需要执行的步骤从40亿个减少到了32个!

从生活入手的查找

假设要在电话簿中找一个名字以K打头的人,(现在谁还用电话簿!)可以从头开始翻页,直到进入以K打头的部分。但你很可能不这样做,而是从中间开始,因为你知道以K打头的名字在电话簿中间。

二分查找的算法分析(图解二分查找算法)(1)

又假设要在字典中找一个以O打头的单词,你也将从中间附近开始。

现在假设你登录Facebook。当你这样做时,Facebook必须核实你是否有其网站的账户,因此必须在其数据库中查找你的用户名。如果你的用户名为karlmageddon,Facebook可从以A打头的部分开始查找,但更合乎逻辑的做法是从中间开始查找。

这是一个查找问题,在前述所有情况下,都可使用同一种算法来解决问题,这种算法就是二分查找

二分查找的算法分析(图解二分查找算法)(2)

做个小游戏

二分查找是一种算法,其输入是一个有序的元素列表(必须有序的原因稍后解释)。如果要查找的元素包含在列表中,二分查找返回其位置;否则返回null。

下图是一个例子。

二分查找的算法分析(图解二分查找算法)(3)

下面的示例说明了二分查找的工作原理。我随便想一个1~100的数字。

二分查找的算法分析(图解二分查找算法)(4)

你的目标是以最少的次数猜到这个数字。你每次猜测后,我会说小了、大了或对了。

假设你从1开始依次往上猜,猜测过程会是这样。

二分查找的算法分析(图解二分查找算法)(5)

这是简单查找,更准确的说法是傻找。每次猜测都只能排除一个数字。如果我想的数字是99,你得猜99次才能猜到!

更佳的查找方式

下面是一种更佳的猜法。从50开始。

二分查找的算法分析(图解二分查找算法)(6)

小了,但排除了一半的数字!至此,你知道1~50都小了。接下来,你猜75。

二分查找的算法分析(图解二分查找算法)(7)

大了,那余下的数字又排除了一半!使用二分查找时,你猜测的是中间的数字,从而每次都将余下的数字排除一半。接下来,你猜63(50和75中间的数字)。

二分查找的算法分析(图解二分查找算法)(8)

这就是二分查找,你学习了第一种算法!每次猜测排除的数字个数如下。

二分查找的算法分析(图解二分查找算法)(9)

不管我心里想的是哪个数字,你在7次之内都能猜到,因为每次猜测都将排除很多数字!

假设你要在字典中查找一个单词,而该字典包含240 000个单词,你认为每种查找最多需要多少步?

二分查找的算法分析(图解二分查找算法)(10)

如果要查找的单词位于字典末尾,使用简单查找将需要240 000步。使用二分查找时,每次排除一半单词,直到最后只剩下一个单词。

二分查找的算法分析(图解二分查找算法)(11)

因此,使用二分查找只需18步——少多了!一般而言,对于包含n个元素的列表,用二分查找最多需要log2n步,而简单查找最多需要n步。

对数

你可能不记得什么是对数了,但很可能记得什么是幂。log10100相当于问“将多少个10相乘的结果为100”。答案是两个:10 × 10 = 100。因此,log10100 = 2。对数运算是幂运算的逆运算。

对数是幂运算的逆运算

本书使用大O表示法讨论运行时间时,log指的都是log2。使用简单查找法查找元素时,在最糟情况下需要查看每个元素。因此,如果列表包含8个数字,你最多需要检查8个数字。而使用二分查找时,最多需要检查log n个元素。如果列表包含8个元素,你最多需要检查3个元素,因为log 8 = 3(23 = 8)。如果列表包含1024个元素,你最多需要检查10个元素,因为log 1024 = 10(210 =1024)。 

说明

仅当列表是有序的时候,二分查找才管用。例如,电话簿中的名字是按字母顺序排列的,因此可以使用二分查找来查找名字。如果名字不是按顺序排列的,结果将如何呢?

执行二分查找的Python代码

下面来看看如何编写执行二分查找的Python代码。这里的代码示例使用了数组。如果你不熟悉数组,也不用担心。你只需知道,可将一系列元素存储在一系列相邻的桶(bucket),即数组中。这些桶从0开始编号:第一个桶的位置为#0,第二个桶为#1,第三个桶为#2,以此类推。

函数binary_search接受一个有序数组和一个元素。如果指定的元素包含在数组中,这个函数将返回其位置。你将跟踪要在其中查找的数组部分——开始时为整个数组。

low = 0 high = len(list) - 1

二分查找的算法分析(图解二分查找算法)(12)

你每次都检查中间的元素。

mid = (low high) / 2 ←---如果(low high)不是偶数,Python自动将mid向下取整。 guess = list[mid]

如果猜的数字小了,就相应地修改low。

if guess < item: low = mid 1

二分查找的算法分析(图解二分查找算法)(13)

如果猜的数字大了,就修改high。完整的代码如下。

def binary_search(list item): low = 0 (以下2行)low和high用于跟踪要在其中查找的列表部分 high = len(list)—1 while low <= high: ←-------------只要范围没有缩小到只包含一个元素, mid = (low high) / 2 ←-------------就检查中间的元素 guess = list[mid] if guess == item: ←-------------找到了元素 return mid if guess > item: ←-------------猜的数字大了 high = mid - 1 else: ←---------------------------猜的数字小了 low = mid 1 return None ←--------------------没有指定的元素 my_list = [1 3 5 7 9] ←------------来测试一下! print binary_search(my_list 3) # => 1 ←--------------------别忘了索引从0开始,第二个位置的索引为1 print binary_search(my_list -1) # => None ←--------------------在Python中,None表示空,它意味着没有找到指定的元素

本文节选自《算法图解》

二分查找的算法分析(图解二分查找算法)(14)

《算法图解》

作者:Aditya Bhargava

本书完成了一项不可能完成的任务:让数学变得有趣而易懂!

你渴望像看喜欢的小说一样学习算法吗?如果是,本书正是你梦寐以求的!

本书示例丰富,图文并茂,以让人容易理解的方式阐释了算法,旨在帮助程序员在日常项目中更好地发挥算法的能量。书中的前三章将帮助你打下基础,余下篇幅主要介绍应用广泛的算法,具体内容包括:何时采用贪婪算法或动态规划;散列表的应用;图算法;K最近邻算法等。

猜您喜欢: