<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Think Again &#187; 算法</title>
	<atom:link href="http://www.thinkagain.cn/archives/tag/%e7%ae%97%e6%b3%95/feed" rel="self" type="application/rss+xml" />
	<link>http://www.thinkagain.cn</link>
	<description>Inspire thinking, inspire creativity, inspire future.</description>
	<lastBuildDate>Wed, 01 Feb 2012 07:31:56 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>常用算法设计方法</title>
		<link>http://www.thinkagain.cn/archives/43.html</link>
		<comments>http://www.thinkagain.cn/archives/43.html#comments</comments>
		<pubDate>Wed, 22 Feb 2006 08:07:57 +0000</pubDate>
		<dc:creator>山之岚</dc:creator>
				<category><![CDATA[Tips]]></category>
		<category><![CDATA[算法]]></category>
		<category><![CDATA[设计]]></category>

		<guid isPermaLink="false">http://lovepc.i-lady.cn/archives/43</guid>
		<description><![CDATA[在网上找到这篇《常用算法设计方法》，虽然代码是C的，但是算法的原理都一样吧。 常用算法设计方法 要使计算机能完成人们预定 的工作，首先必须为如何完成预定的工作设计一个算法，然... ]]></description>
			<content:encoded><![CDATA[<p>在网上找到这篇《常用算法设计方法》，虽然代码是C的，但是算法的原理都一样吧。<br />
常用算法设计方法</p>
<p>要使计算机能完成人们预定 的工作，首先必须为如何完成预定的工作设计一个算法，然后再根据算法编写程序。计算机程序要对问题的每个对象和处理规则给出正确详尽的描述，其中程序的数 据结构和变量用来描述问题的对象，程序结构、函数和语句用来描述问题的算法。算法数据结构是程序的两个重要方面。<br />
算法是问题求解过程的精确描述，一个算法由有限条可完全机械地执行的、有确定结果的指令组成。指令正确地描述了要完成的任务和它们被执行的顺序。计算机按算法指令所描述的顺序执行算法的指令能在有限的步骤内终止，或终止于给出问题的解，或终止于指出问题对此输入数据无解。<br />
通常求解一个问题可能会有多种算法可供选择，选择的主要标准是算法的正确性和可靠性，简单性和易理解性。其次是算法所需要的存储空间少和执行更快等。<br />
算法设计是一件非常困难的工作，经常采用的算法设计技术主要有迭代法、穷举搜索法、递推法、贪婪法、回溯法、分治法、动态规划法等等。另外，为了更简洁的形式设计和藐视算法，在算法设计时又常常采用递归技术，用递归描述算法。</p>
<p>一、迭代法</p>
<p>迭代法是用于求方程或方程组近似根的一种常用的算法设计方法。设方程为f(x)=0，用某种数学方法导出等价的形式x=g(x)，然后按以下步骤执行：<br />
（1） 选一个方程的近似根，赋给变量x0；<br />
（2） 将x0的值保存于变量x1，然后计算g(x1)，并将结果存于变量x0；<br />
（3） 当x0与x1的差的绝对值还小于指定的精度要求时，重复步骤（2）的计算。<br />
若方程有根，并且用上述方法计算出来的近似根序列收敛，则按上述方法求得的x0就认为是方程的根。上述算法用C程序的形式表示为：<br />
【算法】迭代法求方程的根<br />
{ x0=初始近似根；<br />
do {<br />
x1=x0；<br />
x0=g(x1)； /*按特定的方程计算新的近似根*/<br />
} while ( fabs(x0-x1)&gt;Epsilon)；<br />
printf(“方程的近似根是%f\n”，x0)；<br />
}<br />
迭代算法也常用于求方程组的根，令<br />
X=（x0，x1，…，xn-1）<br />
设方程组为：<br />
xi=gi(X) (I=0，1，…，n-1)<br />
则求方程组根的迭代算法可描述如下：<br />
【算法】迭代法求方程组的根<br />
{ for (i=0;i<br />
x[i]=初始近似根;<br />
do {<br />
for (i=0;i<br />
y[i]=x[i];<br />
for (i=0;i<br />
x[i]=gi(X);<br />
for (delta=0.0,i=0;i<br />
if (fabs(y[i]-x[i])&gt;delta) delta=fabs(y[i]-x[i])；<br />
} while (delta&gt;Epsilon)；<br />
for (i=0;i<br />
printf(“变量x[%d]的近似根是 %f”，I，x[i])；<br />
printf(“\n”)；<br />
}<br />
具体使用迭代法求根时应注意以下两种可能发生的情况：<br />
（1） 如果方程无解，算法求出的近似根序列就不会收敛，迭代过程会变成死循环，因此在使用迭代算法前应先考察方程是否有解，并在程序中对迭代的次数给予限制；<br />
（2） 方程虽然有解，但迭代公式选择不当，或迭代的初始近似根选择不合理，也会导致迭代失败。</p>
<p>二、穷举搜索法</p>
<p>穷举搜索法是对可能是解的众多候选解按某种顺序进行逐一枚举和检验，并从众找出那些符合要求的候选解作为问题的解。<br />
【问题】 将A、B、C、D、E、F这六个变量排成如图所示的三角形，这六个变量分别取[1，6]上的整数，且均不相同。求使三角形三条边上的变量之和相等的全部解。如图就是一个解。<br />
程 序引入变量a、b、c、d、e、f，并让它们分别顺序取1至6的证书，在它们互不相同的条件下，测试由它们排成的如图所示的三角形三条边上的变量之和是否 相等，如相等即为一种满足要求的排列，把它们输出。当这些变量取尽所有的组合后，程序就可得到全部可能的解。细节见下面的程序。<br />
【程序1】<br />
# include<br />
void main()<br />
{ int a,b,c,d,e,f;<br />
for (a=1;a&lt;=6;a++)<br />
for (b=1;b&lt;=6;b++) {<br />
if (b==a) continue;<br />
for (c=1;c&lt;=6;c++) {<br />
if (c==a)||(c==b) continue;<br />
for (d=1;d&lt;=6;d++) {<br />
if (d==a)||(d==b)||(d==c) continue;<br />
for (e=1;e&lt;=6;e++) {<br />
if (e==a)||(e==b)||(e==c)||(e==d) continue;<br />
f=21-(a+b+c+d+e);<br />
if ((a+b+c==c+d+e))&amp;&amp;(a+b+c==e+f+a)) {<br />
printf(“%6d,a);<br />
printf(“%4d%4d”,b,f);<br />
printf(“%2d%4d%4d”,c,d,e);<br />
scanf(“%*c”);<br />
}<br />
}<br />
}<br />
}<br />
}<br />
}<br />
按穷举法编写的程序通常不能适应变化的情况。如问题改成有9个变量排成三角形，每条边有4个变量的情况，程序的循环重数就要相应改变。<br />
对 一组数穷尽所有排列，还有更直接的方法。将一个排列看作一个长整数，则所有排列对应着一组整数。将这组整数按从小到大的顺序排列排成一个整数，从对应最小 的整数开始。按数列的递增顺序逐一列举每个排列对应的每个整数，这能更有效地完成排列的穷举。从一个排列找出对应数列的下一个排列可在当前排列的基础上作 部分调整来实现。倘若当前排列为1，2，4，6，5，3，并令其对应的长整数为124653。要寻找比长整数124653更大的排列，可从该排列的最后一 个数字顺序向前逐位考察，当发现排列中的某个数字比它前一个数字大时，如本例中的6比它的前一位数字4大，这说明还有对应更大整数的排列。但为了顺序从小 到大列举出所有的排列，不能立即调整得太大，如本例中将数字6与数字4交换得到的排列126453就不是排列124653的下一个排列。为了得到排列 124653的下一个排列，应从已经考察过的那部分数字中选出比数字大，但又是它们中最小的那一个数字，比如数字5，与数字4交换。该数字也是从后向前考 察过程中第一个比4大的数字。5与4交换后，得到排列125643。在前面数字1，2，5固定的情况下，还应选择对应最小整数的那个排列，为此还需将后面 那部分数字的排列顺序颠倒，如将数字6，4，3的排列顺序颠倒，得到排列1，2，5，3，4，6，这才是排列1，2，4，6，5，3的下一个排列。按以上 想法编写的程序如下。<br />
【程序2】<br />
# include<br />
# define SIDE_N 3<br />
# define LENGTH 3<br />
# define VARIABLES 6<br />
int A,B,C,D,E,F;<br />
int *pt[]={&amp;A,&amp;B,&amp;C,&amp;D,&amp;E,&amp;F};<br />
int *side[SIDE_N][LENGTH]={&amp;A,&amp;B,&amp;C,&amp;C,&amp;D,&amp;E,&amp;E,&amp;F,&amp;A};<br />
int side_total[SIDE_N];<br />
main{}<br />
{ int i,j,t,equal;<br />
for (j=0;j<br />
*pt[j]=j+1;<br />
while(1)<br />
{ for (i=0;i<br />
{ for (t=j=0;j<br />
t+=*side[i][j];<br />
side_total[i]=t;<br />
}<br />
for (equal=1,i=0;equal&amp;&amp;i<br />
if (side_total[i]!=side_total[i+1] equal=0;<br />
if (equal)<br />
{ for (i=1;i<br />
printf(“%4d”,*pt[i]);<br />
printf(“\n”);<br />
scanf(“%*c”);<br />
}<br />
for (j=VARIABLES-1;j&gt;0;j&#8211;)<br />
if (*pt[j]&gt;*pt[j-1]) break;<br />
if (j==0) break;<br />
for (i=VARIABLES-1;i&gt;=j;i&#8211;)<br />
if (*pt[i]&gt;*pt[i-1]) break;<br />
t=*pt[j-1];* pt[j-1] =* pt[i]; *pt[i]=t;<br />
for (i=VARIABLES-1;i&gt;j;i&#8211;,j++)<br />
{ t=*pt[j]; *pt[j] =* pt[i]; *pt[i]=t; }<br />
}<br />
}<br />
从上述问题解决的方法中，最重要的因素就是确定某种方法来确定所有的候选解。下面再用一个示例来加以说明。<br />
【问题】 背包问题<br />
问题描述：有不同价值、不同重量的物品n件，求从这n件物品中选取一部分物品的选择方案，使选中物品的总重量不超过指定的限制重量，但选中物品的价值之和最大。<br />
设n 个物品的重量和价值分别存储于数组w[ ]和v[ ]中，限制重量为tw。考虑一个n元组（x0，x1，…，xn-1），其中xi=0 表示第i个物品没有选取，而xi=1则表示第i个物品被选取。显然这个n元组等价于一个选择方案。用枚举法解决背包问题，需要枚举所有的选取方案，而根据 上述方法，我们只要枚举所有的n元组，就可以得到问题的解。<br />
显然，每个分量取值为0或1的n元组的个数共为2n个。而每个n元组其实对应了一个长度为n的二进制数，且这些二进制数的取值范围为0～2n-1。因此，如果把0～2n-1分别转化为相应的二进制数，则可以得到我们所需要的2n个n元组。<br />
【算法】<br />
maxv=0;<br />
for (i=0;i&lt;2n;i++)<br />
{ B[0..n-1]=0;<br />
把i转化为二进制数，存储于数组B中;<br />
temp_w=0;<br />
temp_v=0;<br />
for (j=0;j<br />
{ if (B[j]==1)<br />
{ temp_w=temp_w+w[j];<br />
temp_v=temp_v+v[j];<br />
}<br />
if ((temp_w&lt;=tw)&amp;&amp;(temp_v&gt;maxv))<br />
{ maxv=temp_v;<br />
保存该B数组；<br />
}<br />
}<br />
}</p>
<p>三、递推法</p>
<p>递 推法是利用问题本身所具有的一种递推关系求问题解的一种方法。设要求问题规模为N的解，当N=1时，解或为已知，或能非常方便地得到解。能采用递推法构造 算法的问题有重要的递推性质，即当得到问题规模为i-1的解后，由问题的递推性质，能从已求得的规模为1，2，…，i-1的一系列解，构造出问题规模为 I的解。这样，程序可从i=0或i=1出发，重复地，由已知至i-1规模的解，通过递推，获得规模为i的解，直至得到规模为N的解。<br />
【问题】 阶乘计算<br />
问题描述：编写程序，对给定的n（n≦100），计算并输出k的阶乘k！（k=1，2，…，n）的全部有效数字。<br />
由于要求的整数可能大大超出一般整数的位数，程序用一维数组存储长整数，存储长整数数组的每个元素只存储长整数的一位数字。如有m位成整数N用数组a[ ]存储：<br />
N=a[m]×10m-1+a[m-1]×10m-2+ … +a[2]×101+a[1]×100<br />
并用a[0]存储长整数N的位数m，即a[0]=m。按上述约定，数组的每个元素存储k的阶乘k！的一位数字，并从低位到高位依次存于数组的第二个元素、第三个元素……。例如，5！=120，在数组中的存储形式为：<br />
3 0 2 1 ……<br />
首元素3表示长整数是一个3位数，接着是低位到高位依次是0、2、1，表示成整数120。<br />
计算阶乘k！可采用对已求得的阶乘(k-1)！连续累加k-1次后求得。例如，已知4！=24，计算5！，可对原来的24累加4次24后得到120。细节见以下程序。<br />
# include<br />
# include<br />
# define MAXN 1000<br />
void pnext(int a[ ],int k)<br />
{ int *b,m=a[0],i,j,r,carry;<br />
b=(int * ) malloc(sizeof(int)* (m+1));<br />
for ( i=1;i&lt;=m;i++) b[i]=a[i];<br />
for ( j=1;j&lt;=k;j++)<br />
{ for ( carry=0,i=1;i&lt;=m;i++)<br />
{ r=(i<br />
a[i]=r%10;<br />
carry=r/10;<br />
}<br />
if (carry) a[++m]=carry;<br />
}<br />
free(b);<br />
a[0]=m;<br />
}</p>
<p>void write(int *a,int k)<br />
{ int i;<br />
printf(“%4d！=”,k);<br />
for (i=a[0];i&gt;0;i&#8211;)<br />
printf(“%d”,a[i]);<br />
printf(“\n\n”);<br />
}</p>
<p>void main()<br />
{ int a[MAXN],n,k;<br />
printf(“Enter the number n: “);<br />
scanf(“%d”,&amp;n);<br />
a[0]=1;<br />
a[1]=1;<br />
write(a,1);<br />
for (k=2;k&lt;=n;k++)<br />
{ pnext(a,k);<br />
write(a,k);<br />
getchar();<br />
}<br />
}</p>
<p>四、递归</p>
<p>递归是设计和描述算法的一种有力的工具，由于它在复杂算法的描述中被经常采用，为此在进一步介绍其他算法设计方法之前先讨论它。<br />
能 采用递归描述的算法通常有这样的特征：为求解规模为N的问题，设法将它分解成规模较小的问题，然后从这些小问题的解方便地构造出大问题的解，并且这些规模 较小的问题也能采用同样的分解和综合方法，分解成规模更小的问题，并从这些更小问题的解构造出规模较大问题的解。特别地，当规模N=1时，能直接得解。<br />
【问题】 编写计算斐波那契（Fibonacci）数列的第n项函数fib（n）。<br />
斐波那契数列为：0、1、1、2、3、……，即：<br />
fib(0)=0;<br />
fib(1)=1;<br />
fib(n)=fib(n-1)+fib(n-2) （当n&gt;1时）。<br />
写成递归函数有：<br />
int fib(int n)<br />
{ if (n==0) return 0;<br />
if (n==1) return 1;<br />
if (n&gt;1) return fib(n-1)+fib(n-2);<br />
}<br />
递 归算法的执行过程分递推和回归两个阶段。在递推阶段，把较复杂的问题（规模为n）的求解推到比原问题简单一些的问题（规模小于n）的求解。例如上例中，求 解fib(n)，把它推到求解fib(n-1)和fib(n-2)。也就是说，为计算fib(n)，必须先计算fib(n-1)和fib(n- 2)，而计算fib(n-1)和fib(n-2)，又必须先计算fib(n-3)和fib(n-4)。依次类推，直至计算fib(1)和fib(0)，分 别能立即得到结果1和0。在递推阶段，必须要有终止递归的情况。例如在函数fib中，当n为1和0的情况。<br />
在回归阶段，当获得最简单情况的解后，逐级返回，依次得到稍复杂问题的解，例如得到fib(1)和fib(0)后，返回得到fib(2)的结果，……，在得到了fib(n-1)和fib(n-2)的结果后，返回得到fib(n)的结果。<br />
在编写递归函数时要注意，函数中的局部变量和参数知识局限于当前调用层，当递推进入“简单问题”层时，原来层次上的参数和局部变量便被隐蔽起来。在一系列“简单问题”层，它们各有自己的参数和局部变量。<br />
由 于递归引起一系列的函数调用，并且可能会有一系列的重复计算，递归算法的执行效率相对较低。当某个递归算法能较方便地转换成递推算法时，通常按递推算法编 写程序。例如上例计算斐波那契数列的第n项的函数fib(n)应采用递推算法，即从斐波那契数列的前两项出发，逐次由前两项计算出下一项，直至计算出要求 的第n项。<br />
【问题】 组合问题<br />
问题描述：找出从自然数1、2、……、n中任取r个数的所有组合。例如n=5，r=3的所有组合为： （1）5、4、3 （2）5、4、2 （3）5、4、1<br />
（4）5、3、2 （5）5、3、1 （6）5、2、1<br />
（7）4、3、2 （8）4、3、1 （9）4、2、1<br />
（10）3、2、1<br />
分 析所列的10个组合，可以采用这样的递归思想来考虑求组合函数的算法。设函数为void comb(int m,int k)为找出从自然数1、2、……、m中任取k个数的所有组合。当组合的第一个数字选定时，其后的数字是从余下的m-1个数中取k-1数的组合。这就将求m 个数中取k个数的组合问题转化成求m-1个数中取k-1个数的组合问题。设函数引入工作数组a[ ]存放求出的组合的数字，约定函数将确定的k个数字组合的第一个数字放在a[k]中，当一个组合求出后，才将a[ ]中的一个组合输出。第一个数可以是m、m-1、……、k，函数将确定组合的第一个数字放入数组后，有两种可能的选择，因还未去顶组合的其余元素，继续递 归去确定；或因已确定了组合的全部元素，输出这个组合。细节见以下程序中的函数comb。<br />
【程序】<br />
# include<br />
# define MAXN 100<br />
int a[MAXN];<br />
void comb(int m,int k)<br />
{ int i,j;<br />
for (i=m;i&gt;=k;i&#8211;)<br />
{ a[k]=i;<br />
if (k&gt;1)<br />
comb(i-1,k-1);<br />
else<br />
{ for (j=a[0];j&gt;0;j&#8211;)<br />
printf(“%4d”,a[j]);<br />
printf(“\n”);<br />
}<br />
}<br />
}</p>
<p>void main()<br />
{ a[0]=3;<br />
comb(5,3);<br />
}<br />
【问题】 背包问题<br />
问题描述：有不同价值、不同重量的物品n件，求从这n件物品中选取一部分物品的选择方案，使选中物品的总重量不超过指定的限制重量，但选中物品的价值之和最大。<br />
设n 件物品的重量分别为w0、w1、…、wn-1，物品的价值分别为v0、v1、…、vn-1。采用递归寻找物品的选择方案。设前面已有了多种选择的方案，并 保留了其中总价值最大的方案于数组option[ ]，该方案的总价值存于变量maxv。当前正在考察新方案，其物品选择情况保存于数组cop[ ]。假定当前方案已考虑了前i-1件物品，现在要考虑第i件物品；当前方案已包含的物品的重量之和为tw；至此，若其余物品都选择是可能的话，本方案能达 到的总价值的期望值为tv。算法引入tv是当一旦当前方案的总价值的期望值也小于前面方案的总价值maxv时，继续考察当前方案变成无意义的工作，应终止 当前方案，立即去考察下一个方案。因为当方案的总价值不比maxv大时，该方案不会被再考察，这同时保证函数后找到的方案一定会比前面的方案更好。<br />
对于第i件物品的选择考虑有两种可能：<br />
（1） 考虑物品i被选择，这种可能性仅当包含它不会超过方案总重量限制时才是可行的。选中后，继续递归去考虑其余物品的选择。<br />
（2） 考虑物品i不被选择，这种可能性仅当不包含物品i也有可能会找到价值更大的方案的情况。<br />
按以上思想写出递归算法如下：<br />
try(物品i，当前选择已达到的重量和，本方案可能达到的总价值tv)<br />
{ /*考虑物品i包含在当前方案中的可能性*/<br />
if(包含物品i是可以接受的)<br />
{ 将物品i包含在当前方案中；<br />
if (i<br />
try(i+1,tw+物品i的重量,tv);<br />
else<br />
/*又一个完整方案，因为它比前面的方案好，以它作为最佳方案*/<br />
以当前方案作为临时最佳方案保存;<br />
恢复物品i不包含状态；<br />
}<br />
/*考虑物品i不包含在当前方案中的可能性*/<br />
if (不包含物品i仅是可男考虑的)<br />
if (i<br />
try(i+1,tw,tv-物品i的价值)；<br />
else<br />
/*又一个完整方案，因它比前面的方案好，以它作为最佳方案*/<br />
以当前方案作为临时最佳方案保存;<br />
}<br />
为了理解上述算法，特举以下实例。设有4件物品，它们的重量和价值见表：<br />
物品 0 1 2 3<br />
重量 5 3 2 1<br />
价值 4 4 3 1</p>
<p>并设限制重量为7。则按以上算法，下图表示找解过程。由图知，一旦找到一个解，算法就进一步找更好的佳。如能判定某个查找分支不会找到更好的解，算法不会在该分支继续查找，而是立即终止该分支，并去考察下一个分支。</p>
<p>按上述算法编写函数和程序如下：<br />
【程序】<br />
# include<br />
# define N 100<br />
double limitW,totV,maxV;<br />
int option[N],cop[N];<br />
struct { double weight;<br />
double value;<br />
}a[N];<br />
int n;<br />
void find(int i,double tw,double tv)<br />
{ int k;<br />
/*考虑物品i包含在当前方案中的可能性*/<br />
if (tw+a[i].weight&lt;=limitW)<br />
{ cop[i]=1;<br />
if (i<br />
else<br />
{ for (k=0;k<br />
option[k]=cop[k];<br />
maxv=tv;<br />
}<br />
cop[i]=0;<br />
}<br />
/*考虑物品i不包含在当前方案中的可能性*/<br />
if (tv-a[i].value&gt;maxV)<br />
if (i<br />
else<br />
{ for (k=0;k<br />
option[k]=cop[k];<br />
maxv=tv-a[i].value;<br />
}<br />
}</p>
<p>void main()<br />
{ int k;<br />
double w,v;<br />
printf(“输入物品种数\n”);<br />
scanf((“%d”,&amp;n);<br />
printf(“输入各物品的重量和价值\n”);<br />
for (totv=0.0,k=0;k<br />
{ scanf(“%1f%1f”,&amp;w,&amp;v);<br />
a[k].weight=w;<br />
a[k].value=v;<br />
totV+=V;<br />
}<br />
printf(“输入限制重量\n”);<br />
scanf(“%1f”,&amp;limitV);<br />
maxv=0.0;<br />
for (k=0;k find(0,0.0,totV);<br />
for (k=0;k<br />
if (option[k]) printf(“%4d”,k+1);<br />
printf(“\n总价值为%.2f\n”,maxv);<br />
}<br />
作 为对比，下面以同样的解题思想，考虑非递归的程序解。为了提高找解速度，程序不是简单地逐一生成所有候选解，而是从每个物品对候选解的影响来形成值得进一 步考虑的候选解，一个候选解是通过依次考察每个物品形成的。对物品i的考察有这样几种情况：当该物品被包含在候选解中依旧满足解的总重量的限制，该物品被 包含在候选解中是应该继续考虑的；反之，该物品不应该包括在当前正在形成的候选解中。同样地，仅当物品不被包括在候选解中，还是有可能找到比目前临时最佳 解更好的候选解时，才去考虑该物品不被包括在候选解中；反之，该物品不包括在当前候选解中的方案也不应继续考虑。对于任一值得继续考虑的方案，程序就去进 一步考虑下一个物品。<br />
【程序】<br />
# include<br />
# define N 100<br />
double limitW;<br />
int cop[N];<br />
struct ele { double weight;<br />
double value;<br />
} a[N];<br />
int k,n;<br />
struct { int ;<br />
double tw;<br />
double tv;<br />
}twv[N];<br />
void next(int i,double tw,double tv)<br />
{ twv[i].=1;<br />
twv[i].tw=tw;<br />
twv[i].tv=tv;<br />
}<br />
double find(struct ele *a,int n)<br />
{ int i,k,f;<br />
double maxv,tw,tv,totv;<br />
maxv=0;<br />
for (totv=0.0,k=0;k<br />
totv+=a[k].value;<br />
next(0,0.0,totv);<br />
i=0;<br />
While (i&gt;=0)<br />
{ f=twv[i].;<br />
tw=twv[i].tw;<br />
tv=twv[i].tv;<br />
switch(f)<br />
{ case 1: twv[i].++;<br />
if (tw+a[i].weight&lt;=limitW)<br />
if (i<br />
{ next(i+1,tw+a[i].weight,tv);<br />
i++;<br />
}<br />
else<br />
{ maxv=tv;<br />
for (k=0;k<br />
cop[k]=twv[k].!=0;<br />
}<br />
break;<br />
case 0: i&#8211;;<br />
break;<br />
default: twv[i].=0;<br />
if (tv-a[i].value&gt;maxv)<br />
if (i<br />
{ next(i+1,tw,tv-a[i].value);<br />
i++;<br />
}<br />
else<br />
{ maxv=tv-a[i].value;<br />
for (k=0;k<br />
cop[k]=twv[k].!=0;<br />
}<br />
break;<br />
}<br />
}<br />
return maxv;<br />
}</p>
<p>void main()<br />
{ double maxv;<br />
printf(“输入物品种数\n”);<br />
scanf((“%d”,&amp;n);<br />
printf(“输入限制重量\n”);<br />
scanf(“%1f”,&amp;limitW);<br />
printf(“输入各物品的重量和价值\n”);<br />
for (k=0;k<br />
scanf(“%1f%1f”,&amp;a[k].weight,&amp;a[k].value);<br />
maxv=find(a,n);<br />
printf(“\n选中的物品为\n”);<br />
for (k=0;k<br />
if (option[k]) printf(“%4d”,k+1);<br />
printf(“\n总价值为%.2f\n”,maxv);<br />
}</p>
<p>五、回溯法</p>
<p>回 溯法也称为试探法，该方法首先暂时放弃关于问题规模大小的限制，并将问题的候选解按某种顺序逐一枚举和检验。当发现当前候选解不可能是解时，就选择下一个 候选解；倘若当前候选解除了还不满足问题规模要求外，满足所有其他要求时，继续扩大当前候选解的规模，并继续试探。如果当前候选解满足包括问题规模在内的 所有要求时，该候选解就是问题的一个解。在回溯法中，放弃当前候选解，寻找下一个候选解的过程称为回溯。扩大当前候选解的规模，以继续试探的过程称为向前 试探。<br />
1、回溯法的一般描述<br />
可用回溯法求解的问题P，通常要能表达为：对于已知的由n元组（x1，x2，…，xn）组成的一个状态空间 E={（x1，x2，…，xn）∣xi∈Si ，i=1，2，…，n}，给定关于n元组中的一个分量的一个约束集D，要求E中满足D的全部约束条件的所有n元组。其中Si是分量xi的定义域，且 |Si| 有限，i=1，2，…，n。我们称E中满足D的全部约束条件的任一n元组为问题P的一个解。<br />
解问题P的最朴素的方法就是枚举法，即对E中的所有n元组逐一地检测其是否满足D的全部约束，若满足，则为问题P的一个解。但显然，其计算量是相当大的。<br />
我 们发现，对于许多问题，所给定的约束集D具有完备性，即i元组（x1，x2，…，xi）满足D中仅涉及到x1，x2，…，xi的所有约束意味着j （jj。因此，对于约束集D具有完备性的问题P，一旦检测断定某个j元组（x1，x2，…，xj）违反D中仅涉及x1，x2，…，xj的一个约束，就可以 肯定，以（x1，x2，…，xj）为前缀的任何n元组（x1，x2，…，xj，xj+1，…，xn）都不会是问题P的解，因而就不必去搜索它们、检测它 们。回溯法正是针对这类问题，利用这类问题的上述性质而提出来的比枚举法效率更高的算法。<br />
回溯法首先将问题P的n元组的状态空间E表示成一棵高为n的带权有序树T，把在E中求问题P的所有解转化为在T中搜索问题P的所有解。树T类似于检索树，它可以这样构造：<br />
设Si 中的元素可排成xi(1) ，xi(2) ，…，xi(mi-1) ，|Si| =mi，i=1，2，…，n。从根开始，让T的第I层的每一个结点都有mi个儿子。这mi个儿子到它们的双亲的边，按从左到右的次序，分别带权xi+1 (1) ，xi+1(2) ，…，xi+1(mi) ，i=0，1，2，…，n-1。照这种构造方式，E中的一个n元组（x1，x2，…，xn）对应于T中的一个叶子结点，T的根到这个叶子结点的路径上依次 的n条边的权分别为x1，x2，…，xn，反之亦然。另外，对于任意的0≤i≤n-1，E中n元组（x1，x2，…，xn）的一个前缀I元组（x1， x2，…，xi）对应于T中的一个非叶子结点，T的根到这个非叶子结点的路径上依次的I条边的权分别为x1，x2，…，xi，反之亦然。特别，E中的任意 一个n元组的空前缀（），对应于T的根。<br />
因而，在E中寻找问题P的一个解等价于在T中搜索一个叶子结点，要求从T的根到该叶子结点的路径上依次的 n条边相应带的n个权x1，x2，…，xn满足约束集D的全部约束。在T中搜索所要求的叶子结点，很自然的一种方式是从根出发，按深度优先的策略逐步深 入，即依次搜索满足约束条件的前缀1元组（x1i）、前缀2元组（x1，x2）、…，前缀I元组（x1，x2，…，xi），…，直到i=n为止。<br />
在回溯法中，上述引入的树被称为问题P的状态空间树；树T上任意一个结点被称为问题P的状态结点；树T上的任意一个叶子结点被称为问题P的一个解状态结点；树T上满足约束集D的全部约束的任意一个叶子结点被称为问题P的一个回答状态结点，它对应于问题P的一个解。<br />
【问题】 组合问题<br />
问题描述：找出从自然数1、2、……、n中任取r个数的所有组合。<br />
例如n=5，r=3的所有组合为：<br />
（1）1、2、3 （2）1、2、4 （3）1、2、5<br />
（4）1、3、4 （5）1、3、5 （6）1、4、5<br />
（7）2、3、4 （8）2、3、5 （9）2、4、5<br />
（10）3、4、5<br />
则该问题的状态空间为：<br />
E={（x1，x2，x3）∣xi∈S ，i=1，2，3 } 其中：S={1，2，3，4，5}<br />
约束集为： x1<br />
显然该约束集具有完备性。<br />
2、回溯法的方法<br />
对于具有完备约束集D的一般问题P及其相应的状态空间树T，利用T的层次结构和D的完备性，在T中搜索问题P的所有解的回溯法可以形象地描述为：<br />
从T 的根出发，按深度优先的策略，系统地搜索以其为根的子树中可能包含着回答结点的所有状态结点，而跳过对肯定不含回答结点的所有子树的搜索，以提高搜索效 率。具体地说，当搜索按深度优先策略到达一个满足D中所有有关约束的状态结点时，即“激活”该状态结点，以便继续往深层搜索；否则跳过对以该状态结点为根 的子树的搜索，而一边逐层地向该状态结点的祖先结点回溯，一边“杀死”其儿子结点已被搜索遍的祖先结点，直到遇到其儿子结点未被搜索遍的祖先结点，即转向 其未被搜索的一个儿子结点继续搜索。<br />
在搜索过程中，只要所激活的状态结点又满足终结条件，那么它就是回答结点，应该把它输出或保存。由于在回溯法求解问题时，一般要求出问题的所有解，因此在得到回答结点后，同时也要进行回溯，以便得到问题的其他解，直至回溯到T的根且根的所有儿子结点均已被搜索过为止。<br />
例 如在组合问题中，从T的根出发深度优先遍历该树。当遍历到结点（1，2）时，虽然它满足约束条件，但还不是回答结点，则应继续深度遍历；当遍历到叶子结点 （1，2，5）时，由于它已是一个回答结点，则保存（或输出）该结点，并回溯到其双亲结点，继续深度遍历；当遍历到结点（1，5）时，由于它已是叶子结 点，但不满足约束条件，故也需回溯。<br />
3、回溯法的一般流程和技术<br />
在用回溯法求解有关问题的过程中，一般是一边建树，一边遍历该树。在回溯法中我们一般采用非递归方法。下面，我们给出回溯法的非递归算法的一般流程：</p>
<p>在用回溯法求解问题，也即在遍历状态空间树的过程中，如果采用非递归方法，则我们一般要用到栈的数据结构。这时，不仅可以用栈来表示正在遍历的树的结点，而且可以很方便地表示建立孩子结点和回溯过程。<br />
例 如在组合问题中，我们用一个一维数组Stack[ ]表示栈。开始栈空，则表示了树的根结点。如果元素1进栈，则表示建立并遍历（1）结点；这时如果元素2进栈，则表示建立并遍历（1，2）结点；元素3再 进栈，则表示建立并遍历（1，2，3）结点。这时可以判断它满足所有约束条件，是问题的一个解，输出（或保存）。这时只要栈顶元素（3）出栈，即表示从结 点（1，2，3）回溯到结点（1，2）。<br />
【问题】 组合问题<br />
问题描述：找出从自然数1，2，…，n中任取r个数的所有组合。<br />
采用回溯法找问题的解，将找到的组合以从小到大顺序存于a[0]，a[1]，…，a[r-1]中，组合的元素满足以下性质：<br />
（1） a[i+1]&gt;a[i]，后一个数字比前一个大；<br />
（2） a[i]-i&lt;=n-r+1。<br />
按回溯法的思想，找解过程可以叙述如下：<br />
首 先放弃组合数个数为r的条件，候选组合从只有一个数字1开始。因该候选解满足除问题规模之外的全部条件，扩大其规模，并使其满足上述条件（1），候选组合 改为1，2。继续这一过程，得到候选组合1，2，3。该候选解满足包括问题规模在内的全部条件，因而是一个解。在该解的基础上，选下一个候选解，因a [2]上的3调整为4，以及以后调整为5都满足问题的全部要求，得到解1，2，4和1，2，5。由于对5不能再作调整，就要从a[2]回溯到a[1]，这 时，a[1]=2，可以调整为3，并向前试探，得到解1，3，4。重复上述向前试探和向后回溯，直至要从a[0]再回溯时，说明已经找完问题的全部解。按 上述思想写成程序如下：<br />
【程序】<br />
# define MAXN 100<br />
int a[MAXN];<br />
void comb(int m,int r)<br />
{ int i,j;<br />
i=0;<br />
a[i]=1;<br />
do {<br />
if (a[i]-i&lt;=m-r+1<br />
{ if (i==r-1)<br />
{ for (j=0;j<br />
printf(“%4d”,a[j]);<br />
printf(“\n”);<br />
}<br />
a[i]++;<br />
continue;<br />
}<br />
else<br />
{ if (i==0)<br />
return;<br />
a[--i]++;<br />
}<br />
} while (1)<br />
}</p>
<p>main()<br />
{ comb(5,3);<br />
}<br />
【问题】 填字游戏<br />
问题描述：在3×3个方格的方阵中要填入数字1到N（N≥10）内的某9个数字，每个方格填一个整数，似的所有相邻两个方格内的两个整数之和为质数。试求出所有满足这个要求的各种数字填法。<br />
可 用试探发找到问题的解，即从第一个方格开始，为当前方格寻找一个合理的整数填入，并在当前位置正确填入后，为下一方格寻找可填入的合理整数。如不能为当前 方格找到一个合理的可填证书，就要回退到前一方格，调整前一方格的填入数。当第九个方格也填入合理的整数后，就找到了一个解，将该解输出，并调整第九个的 填入的整数，寻找下一个解。<br />
为找到一个满足要求的9个数的填法，从还未填一个数开始，按某种顺序（如从小到大的顺序）每次在当前位置填入一个整 数，然后检查当前填入的整数是否能满足要求。在满足要求的情况下，继续用同样的方法为下一方格填入整数。如果最近填入的整数不能满足要求，就改变填入的整 数。如对当前方格试尽所有可能的整数，都不能满足要求，就得回退到前一方格，并调整前一方格填入的整数。如此重复执行扩展、检查或调整、检查，直到找到一 个满足问题要求的解，将解输出。<br />
回溯法找一个解的算法：<br />
{ int m=0,ok=1;<br />
int n=8;<br />
do{<br />
if (ok) 扩展;<br />
else 调整;<br />
ok=检查前m个整数填放的合理性;<br />
} while ((!ok||m!=n)&amp;&amp;(m!=0))<br />
if (m!=0) 输出解;<br />
else 输出无解报告；<br />
}<br />
如果程序要找全部解，则在将找到的解输出后，应继续调整最后位置上填放的整数，试图去找下一个解。相应的算法如下：<br />
回溯法找全部解的算法：<br />
{ int m=0,ok=1;<br />
int n=8;<br />
do{<br />
if (ok)<br />
{ if (m==n)<br />
{ 输出解；<br />
调整；<br />
}<br />
else 扩展;<br />
}<br />
else 调整;<br />
ok=检查前m个整数填放的合理性;<br />
} while (m!=0);<br />
}<br />
为 了确保程序能够终止，调整时必须保证曾被放弃过的填数序列不会再次实验，即要求按某种有许模型生成填数序列。给解的候选者设定一个被检验的顺序，按这个顺 序逐一形成候选者并检验。从小到大或从大到小，都是可以采用的方法。如扩展时，先在新位置填入整数1，调整时，找当前候选解中下一个还未被使用过的整数。 将上述扩展、调整、检验都编写成程序，细节见以下找全部解的程序。<br />
【程序】<br />
# include<br />
# define N 12<br />
void write(int a[ ])<br />
{ int i,j;<br />
for (i=0;i&lt;3;i++)<br />
{ for (j=0;j&lt;3;j++)<br />
printf(“%3d”,a[3*i+j]);<br />
printf(“\n”);<br />
}<br />
scanf(“%*c”);<br />
}</p>
<p>int b[N+1];<br />
int a[10];<br />
int isprime(int m)<br />
{ int i;<br />
int primes[ ]={2,3,5,7,11,17,19,23,29,-1};<br />
if (m==1||m%2=0) return 0;<br />
for (i=0;primes[i]&gt;0;i++)<br />
if (m==primes[i]) return 1;<br />
for (i=3;i*i&lt;=m;)<br />
{ if (m%i==0) return 0;<br />
i+=2;<br />
}<br />
return 1;<br />
}</p>
<p>int checkmatrix[ ][3]={ {-1},{0,-1},{1,-1},{0,-1},{1,3,-1},<br />
{2,4,-1},{3,-1},{4,6,-1},{5,7,-1}};<br />
int selectnum(int start)<br />
{ int j;<br />
for (j=start;j&lt;=N;j++)<br />
if (b[j]) return j<br />
return 0;<br />
}</p>
<p>int check(int pos)<br />
{ int i,j;<br />
if (pos&lt;0) return 0;<br />
for (i=0;(j=checkmatrix[pos][i])&gt;=0;i++)<br />
if (!isprime(a[pos]+a[j])<br />
return 0;<br />
return 1;<br />
}</p>
<p>int extend(int pos)<br />
{ a[++pos]=selectnum(1);<br />
b[a][pos]]=0;<br />
return pos;<br />
}</p>
<p>int change(int pos)<br />
{ int j;<br />
while (pos&gt;=0&amp;&amp;(j=selectnum(a[pos]+1))==0)<br />
b[a[pos--]]=1;<br />
if (pos&lt;0) return –1<br />
b[a[pos]]=1;<br />
a[pos]=j;<br />
b[j]=0;<br />
return pos;<br />
}</p>
<p>void find()<br />
{ int ok=0,pos=0;<br />
a[pos]=1;<br />
b[a[pos]]=0;<br />
do {<br />
if (ok)<br />
if (pos==8)<br />
{ write(a);<br />
pos=change(pos);<br />
}<br />
else pos=extend(pos);<br />
else pos=change(pos);<br />
ok=check(pos);<br />
} while (pos&gt;=0)<br />
}</p>
<p>void main()<br />
{ int i;<br />
for (i=1;i&lt;=N;i++)<br />
b[i]=1;<br />
find();<br />
}<br />
【问题】 n皇后问题<br />
问题描述：求出在一个n×n的棋盘上，放置n个不能互相捕捉的国际象棋“皇后”的所有布局。<br />
这是来源于国际象棋的一个问题。皇后可以沿着纵横和两条斜线4个方向相互捕捉。如图所示，一个皇后放在棋盘的第4行第3列位置上，则棋盘上凡打“×”的位置上的皇后就能与这个皇后相互捕捉。</p>
<p>1 2 3 4 5 6 7 8<br />
× ×<br />
× × ×<br />
× × ×<br />
× × Q × × × × ×<br />
× × ×<br />
× × ×<br />
× ×<br />
× ×<br />
从图中可以得到以下启示：一个合适的解应是在每列、每行上只有一个皇后，且一条斜线上也只有一个皇后。<br />
求 解过程从空配置开始。在第1列至第m列为合理配置的基础上，再配置第m+1列，直至第n列配置也是合理时，就找到了一个解。接着改变第n列配置，希望获得 下一个解。另外，在任一列上，可能有n种配置。开始时配置在第1行，以后改变时，顺次选择第2行、第3行、…、直到第n行。当第n行配置也找不到一个合理 的配置时，就要回溯，去改变前一列的配置。得到求解皇后问题的算法如下：<br />
{ 输入棋盘大小值n；<br />
m=0;<br />
good=1;<br />
do {<br />
if (good)<br />
if (m==n)<br />
{ 输出解；<br />
改变之，形成下一个候选解;<br />
}<br />
else 扩展当前候选接至下一列；<br />
else 改变之，形成下一个候选解；<br />
good=检查当前候选解的合理性；<br />
} while (m!=0);<br />
}<br />
在 编写程序之前，先确定边式棋盘的数据结构。比较直观的方法是采用一个二维数组，但仔细观察就会发现，这种表示方法给调整候选解及检查其合理性带来困难。更 好的方法乃是尽可能直接表示那些常用的信息。对于本题来说，“常用信息”并不是皇后的具体位置，而是“一个皇后是否已经在某行和某条斜线合理地安置好 了”。因在某一列上恰好放一个皇后，引入一个一维数组（col[ ]），值col[i]表示在棋盘第i列、col[i]行有一个皇后。例如：col[3]=4，就表示在棋盘的第3列、第4行上有一个皇后。另外，为了使程 序在找完了全部解后回溯到最初位置，设定col[0]的初值为0当回溯到第0列时，说明程序已求得全部解，结束程序运行。<br />
为使程序在检查皇后配置的合理性方面简易方便，引入以下三个工作数组：<br />
（1） 数组a[ ]，a[k]表示第k行上还没有皇后；<br />
（2） 数组b[ ]，b[k]表示第k列右高左低斜线上没有皇后；<br />
（3） 数组 c[ ]，c[k]表示第k列左高右低斜线上没有皇后；<br />
棋盘中同一右高左低斜线上的方格，他们的行号与列号之和相同；同一左高右低斜线上的方格，他们的行号与列号之差均相同。<br />
初 始时，所有行和斜线上均没有皇后，从第1列的第1行配置第一个皇后开始，在第m列col[m]行放置了一个合理的皇后后，准备考察第m+1列时，在数组 a[ ]、b[ ]和c[ ]中为第m列，col[m]行的位置设定有皇后标志；当从第m列回溯到第m-1列，并准备调整第m-1列的皇后配置时，清除在数组a[ ]、b[ ]和c[ ]中设置的关于第m-1列，col[m-1]行有皇后的标志。一个皇后在m列，col[m]行方格内配置是合理的，由数组a[ ]、b[ ]和c[ ]对应位置的值都为1来确定。细节见以下程序：<br />
【程序】<br />
# include<br />
# include<br />
# define MAXN 20<br />
int n,m,good;<br />
int col[MAXN+1],a[MAXN+1],b[2*MAXN+1],c[2*MAXN+1];</p>
<p>void main()<br />
{ int j;<br />
char awn;<br />
printf(“Enter n: “); scanf(“%d”,&amp;n);<br />
for (j=0;j&lt;=n;j++) a[j]=1;<br />
for (j=0;j&lt;=2*n;j++) cb[j]=c[j]=1;<br />
m=1; col[1]=1; good=1; col[0]=0;<br />
do {<br />
if (good)<br />
if (m==n)<br />
{ printf(“列\t行”);<br />
for (j=1;j&lt;=n;j++)<br />
printf(“%3d\t%d\n”,j,col[j]);<br />
printf(“Enter a character (Q/q for exit)!\n”);<br />
scanf(“%c”,&amp;awn);<br />
if (awn==’Q’||awn==’q’) exit(0);<br />
while (col[m]==n)<br />
{ m&#8211;;<br />
a[col[m]]=b[m+col[m]]=c[n+m-col[m]]=1;<br />
}<br />
col[m]++;<br />
}<br />
else<br />
{ a[col[m]]=b[m+col[m]]=c[n+m-col[m]]=0;<br />
col[++m]=1;<br />
}<br />
else<br />
{ while (col[m]==n)<br />
{ m&#8211;;<br />
a[col[m]]=b[m+col[m]]=c[n+m-col[m]]=1;<br />
}<br />
col[m]++;<br />
}<br />
good=a[col[m]]&amp;&amp;b[m+col[m]]&amp;&amp;c[n+m-col[m]];<br />
} while (m!=0);<br />
}<br />
试探法找解算法也常常被编写成递归函数，下面两程序中的函数queen_all()和函数queen_one()能分别用来解皇后问题的全部解和一个解。<br />
【程序】<br />
# include<br />
# include<br />
# define MAXN 20<br />
int n;<br />
int col[MAXN+1],a[MAXN+1],b[2*MAXN+1],c[2*MAXN+1];<br />
void main()<br />
{ int j;<br />
printf(“Enter n: “); scanf(“%d”,&amp;n);<br />
for (j=0;j&lt;=n;j++) a[j]=1;<br />
for (j=0;j&lt;=2*n;j++) cb[j]=c[j]=1;<br />
queen_all(1,n);<br />
}</p>
<p>void queen_all(int k,int n)<br />
{ int i,j;<br />
char awn;<br />
for (i=1;i&lt;=n;i++)<br />
if (a[i]&amp;&amp;b[k+i]&amp;&amp;c[n+k-i])<br />
{ col[k]=i;<br />
a[i]=b[k+i]=c[n+k-i]=0;<br />
if (k==n)<br />
{ printf(“列\t行”);<br />
for (j=1;j&lt;=n;j++)<br />
printf(“%3d\t%d\n”,j,col[j]);<br />
printf(“Enter a character (Q/q for exit)!\n”);<br />
scanf(“%c”,&amp;awn);<br />
if (awn==’Q’||awn==’q’) exit(0);<br />
}<br />
queen_all(k+1,n);<br />
a[i]=b[k+i]=c[n+k-i];<br />
}<br />
}<br />
采 用递归方法找一个解与找全部解稍有不同，在找一个解的算法中，递归算法要对当前候选解最终是否能成为解要有回答。当它成为最终解时，递归函数就不再递归试 探，立即返回；若不能成为解，就得继续试探。设函数queen_one()返回1表示找到解，返回0表示当前候选解不能成为解。细节见以下函数。<br />
【程序】<br />
# define MAXN 20<br />
int n;<br />
int col[MAXN+1],a[MAXN+1],b[2*MAXN+1],c[2*MAXN+1];<br />
int queen_one(int k,int n)<br />
{ int i,found;<br />
i=found=0;<br />
While (!found&amp;&amp;i<br />
{ i++;<br />
if (a[i]&amp;&amp;b[k+i]&amp;&amp;c[n+k-i])<br />
{ col[k]=i;<br />
a[i]=b[k+i]=c[n+k-i]=0;<br />
if (k==n) return 1;<br />
else<br />
found=queen_one(k+1,n);<br />
a[i]=b[k+i]=c[n+k-i]=1;<br />
}<br />
}<br />
return found;<br />
}</p>
<p>六、贪婪法</p>
<p>贪婪法是一种不追求最优解，只希望得到较为满意解的方法。贪婪法一般可以快速得到满意的解，因为它省去了为找最优解要穷尽所有可能而必须耗费的大量时间。贪婪法常以当前情况为基础作最优选择，而不考虑各种可能的整体情况，所以贪婪法不要回溯。<br />
例 如平时购物找钱时，为使找回的零钱的硬币数最少，不考虑找零钱的所有各种发表方案，而是从最大面值的币种开始，按递减的顺序考虑各币种，先尽量用大面值的 币种，当不足大面值币种的金额时才去考虑下一种较小面值的币种。这就是在使用贪婪法。这种方法在这里总是最优，是因为银行对其发行的硬币种类和硬币面值的 巧妙安排。如只有面值分别为1、5和11单位的硬币，而希望找回总额为15单位的硬币。按贪婪算法，应找1个11单位面值的硬币和4个1单位面值的硬币， 共找回5个硬币。但最优的解应是3个5单位面值的硬币。<br />
【问题】 装箱问题<br />
问题描述：装箱问题可简述如下：设有编号为0、 1、…、n-1的n种物品，体积分别为v0、v1、…、vn-1。将这n种物品装到容量都为V的若干箱子里。约定这n种物品的体积均不超过V，即对于 0≤i＜n，有0＜vi≤V。不同的装箱方案所需要的箱子数目可能不同。装箱问题要求使装尽这n种物品的箱子数要少。<br />
若考察将n种物品的集合分划 成n个或小于n个物品的所有子集，最优解就可以找到。但所有可能划分的总数太大。对适当大的n，找出所有可能的划分要花费的时间是无法承受的。为此，对装 箱问题采用非常简单的近似算法，即贪婪法。该算法依次将物品放到它第一个能放进去的箱子中，该算法虽不能保证找到最优解，但还是能找到非常好的解。不失一 般性，设n件物品的体积是按从大到小排好序的，即有v0≥v1≥…≥vn-1。如不满足上述要求，只要先对这n件物品按它们的体积从大到小排序，然后按排 序结果对物品重新编号即可。装箱算法简单描述如下：<br />
{ 输入箱子的容积；<br />
输入物品种数n；<br />
按体积从大到小顺序，输入各物品的体积；<br />
预置已用箱子链为空；<br />
预置已用箱子计数器box_count为0；<br />
for (i=0;i<br />
{ 从已用的第一只箱子开始顺序寻找能放入物品i 的箱子j；<br />
if （已用箱子都不能再放物品i）<br />
{ 另用一个箱子，并将物品i放入该箱子；<br />
box_count++；<br />
}<br />
else<br />
将物品i放入箱子j；<br />
}<br />
}<br />
上 述算法能求出需要的箱子数box_count，并能求出各箱子所装物品。下面的例子说明该算法不一定能找到最优解，设有6种物品，它们的体积分别为： 60、45、35、20、20和20单位体积，箱子的容积为100个单位体积。按上述算法计算，需三只箱子，各箱子所装物品分别为：第一只箱子装物品1、 3；第二只箱子装物品2、4、5；第三只箱子装物品6。而最优解为两只箱子，分别装物品1、4、5和2、3、6。<br />
若每只箱子所装物品用链表来表示，链表首结点指针存于一个结构中，结构记录尚剩余的空间量和该箱子所装物品链表的首指针。另将全部箱子的信息也构成链表。以下是按以上算法编写的程序。<br />
【程序】<br />
# include<br />
# include<br />
typedef struct ele<br />
{ int vno;<br />
struct ele *link;<br />
} ELE;<br />
typedef struct hnode<br />
{ int remainder;<br />
ELE *head;<br />
Struct hnode *next;<br />
} HNODE;</p>
<p>void main()<br />
{ int n, i, box_count, box_volume, *a;<br />
HNODE *box_h, *box_t, *j;<br />
ELE *p, *q;<br />
Printf(“输入箱子容积\n”);<br />
Scanf(“%d”,&amp;box_volume);<br />
Printf(“输入物品种数\n”);<br />
Scanf(“%d”,&amp;n);<br />
A=(int *)malloc(sizeof(int)*n);<br />
Printf(“请按体积从大到小顺序输入各物品的体积：”);<br />
For (i=0;i<br />
Box_h=box_t=NULL;<br />
Box_count=0;<br />
For (i=0;i<br />
{ p=(ELE *)malloc(sizeof(ELE));<br />
p-&gt;vno=i;<br />
for (j=box_h;j!=NULL;j=j-&gt;next)<br />
if (j-&gt;remainder&gt;=a) break;<br />
if (j==NULL)<br />
{ j=(HNODE *)malloc(sizeof(HNODE));<br />
j-&gt;remainder=box_volume-a;<br />
j-&gt;head=NULL;<br />
if (box_h==NULL) box_h=box_t=j;<br />
else box_t=boix_t-&gt;next=j;<br />
j-&gt;next=NULL;<br />
box_count++;<br />
}<br />
else j-&gt;remainder-=a;<br />
for (q=j-&gt;next;q!=NULL&amp;&amp;q-&gt;link!=NULL;q=q-&gt;link);<br />
if (q==NULL)<br />
{ p-&gt;link=j-&gt;head;<br />
j-&gt;head=p;<br />
}<br />
else<br />
{ p-&gt;link=NULL;<br />
q-&gt;link=p;<br />
}<br />
}<br />
printf(“共使用了%d只箱子”，box_count);<br />
printf(“各箱子装物品情况如下：”);<br />
for (j=box_h,i=1;j!=NULL;j=j-&gt;next,i++)<br />
{ printf(“第%2d只箱子，还剩余容积%4d，所装物品有；\n”,I,j-&gt;remainder);<br />
for (p=j-&gt;head;p!=NULL;p=p-&gt;link)<br />
printf(“%4d”,p-&gt;vno+1);<br />
printf(“\n”);<br />
}<br />
}<br />
【问题】 马的遍历<br />
问题描述：在8×8方格的棋盘上，从任意指定的方格出发，为马寻找一条走遍棋盘每一格并且只经过一次的一条路径。<br />
马 在某个方格，可以在一步内到达的不同位置最多有8个，如图所示。如用二维数组board[ ][ ]表示棋盘，其元素记录马经过该位置时的步骤号。另对马的8种可能走法（称为着法）设定一个顺序，如当前位置在棋盘的（i，j）方格，下一个可能的位置依 次为（i+2，j+1）、（i+1，j+2）、（i-1，j+2）、（i-2，j+1）、（i-2，j-1）、（i-1，j-2）、（i+1，j-2）、 （i+2，j-1），实际可以走的位置尽限于还未走过的和不越出边界的那些位置。为便于程序的同意处理，可以引入两个数组，分别存储各种可能走法对当前位 置的纵横增量。<br />
4 3<br />
5 2<br />
马<br />
6 1<br />
7 0</p>
<p>对于本题，一般可以采用回溯法，这里采用 Warnsdoff策略求解，这也是一种贪婪法，其选择下一出口的贪婪标准是在那些允许走的位置中，选择出口最少的那个位置。如马的当前位置（i，j）只 有三个出口，他们是位置（i+2，j+1）、（i-2，j+1）和（i-1，j-2），如分别走到这些位置，这三个位置又分别会有不同的出口，假定这三个 位置的出口个数分别为4、2、3，则程序就选择让马走向（i-2，j+1）位置。<br />
由于程序采用的是一种贪婪法，整个找解过程是一直向前，没有回 溯，所以能非常快地找到解。但是，对于某些开始位置，实际上有解，而该算法不能找到解。对于找不到解的情况，程序只要改变8种可能出口的选择顺序，就能找 到解。改变出口选择顺序，就是改变有相同出口时的选择标准。以下程序考虑到这种情况，引入变量start，用于控制8种可能着法的选择顺序。开始时为0， 当不能找到解时，就让start增1，重新找解。细节以下程序。<br />
【程序】<br />
# include<br />
int delta_i[ ]={2,1,-1,-2,-2,-1,1,2};<br />
int delta_j[ ]={1,2,2,1,-1,-2,-2,-1};<br />
int board[8][8];<br />
int exitn(int i,int j,int s,int a[ ])<br />
{ int i1,j1,k,count;<br />
for (count=k=0;k&lt;8;k++)<br />
{ i1=i+delta_i[(s+k)%8];<br />
j1=i+delta_j[(s+k)%8];<br />
if (i1&gt;=0&amp;&amp;i1&lt;8&amp;&amp;j1&gt;=0&amp;&amp;j1&lt;8&amp;&amp;board[I1][j1]==0)<br />
a[count++]=(s+k)%8;<br />
}<br />
return count;<br />
}</p>
<p>int next(int i,int j,int s)<br />
{ int m,k,mm,min,a[8],b[8],temp;<br />
m=exitn(i,j,s,a);<br />
if (m==0) return –1;<br />
for (min=9,k=0;k<br />
{ temp=exitn(I+delta_i[a[k]],j+delta_j[a[k]],s,b);<br />
if (temp<br />
{ min=temp;<br />
kk=a[k];<br />
}<br />
}<br />
return kk;<br />
}</p>
<p>void main()<br />
{ int sx,sy,i,j,step,no,start;<br />
for (sx=0;sx&lt;8;sx++)<br />
for (sy=0;sy&lt;8;sy++)<br />
{ start=0;<br />
do {<br />
for (i=0;i&lt;8;i++)<br />
for (j=0;j&lt;8;j++)<br />
board[j]=0;<br />
board[sx][sy]=1;<br />
I=sx; j=sy;<br />
For (step=2;step&lt;64;step++)<br />
{ if ((no=next(i,j,start))==-1) break;<br />
I+=delta_i[no];<br />
j+=delta_j[no];<br />
board[j]=step;<br />
}<br />
if (step&gt;64) break;<br />
start++;<br />
} while(step&lt;=64)<br />
for (i=0;i&lt;8;i++)<br />
{ for (j=0;j&lt;8;j++)<br />
printf(“%4d”,board[j]);<br />
printf(“\n\n”);<br />
}<br />
scanf(“%*c”);<br />
}<br />
}<br />
七、分治法</p>
<p>1、分治法的基本思想<br />
任 何一个可以用计算机求解的问题所需的计算时间都与其规模N有关。问题的规模越小，越容易直接求解，解题所需的计算时间也越少。例如，对于n个元素的排序问 题，当n=1时，不需任何计算；n=2时，只要作一次比较即可排好序；n=3时只要作3次比较即可，…。而当n较大时，问题就不那么容易处理了。要想直接 解决一个规模较大的问题，有时是相当困难的。<br />
分治法的设计思想是，将一个难以直接解决的大问题，分割成一些规模较小的相同问题，以便各个击破，分而治之。<br />
如果原问题可分割成k个子问题（1<br />
2、分治法的适用条件<br />
分治法所能解决的问题一般具有以下几个特征：<br />
（1）该问题的规模缩小到一定的程度就可以容易地解决；<br />
（2）该问题可以分解为若干个规模较小的相同问题，即该问题具有最优子结构性质；<br />
（3）利用该问题分解出的子问题的解可以合并为该问题的解；<br />
（4）该问题所分解出的各个子问题是相互独立的，即子问题之间不包含公共的子子问题。<br />
上 述的第一条特征是绝大多数问题都可以满足的，因为问题的计算复杂性一般是随着问题规模的增加而增加；第二条特征是应用分治法的前提，它也是大多数问题可以 满足的，此特征反映了递归思想的应用；第三条特征是关键，能否利用分治法完全取决于问题是否具有第三条特征，如果具备了第一条和第二条特征，而不具备第三 条特征，则可以考虑贪心法或动态规划法。第四条特征涉及到分治法的效率，如果各子问题是不独立的，则分治法要做许多不必要的工作，重复地解公共的子问题， 此时虽然可用分治法，但一般用动态规划法较好。<br />
3、分治法的基本步骤<br />
分治法在每一层递归上都有三个步骤：<br />
（1）分解：将原问题分解为若干个规模较小，相互独立，与原问题形式相同的子问题；<br />
（2）解决：若子问题规模较小而容易被解决则直接解，否则递归地解各个子问题；<br />
（3）合并：将各个子问题的解合并为原问题的解。<br />
它的一般的算法设计模式如下：<br />
Divide_and_Conquer（P）<br />
if |P|≤n0<br />
then return（ADHOC（P））<br />
将P分解为较小的子问题P1、P2、…、Pk<br />
for i←1 to k<br />
do<br />
yi ← Divide-and-Conquer（Pi） △ 递归解决Pi<br />
T ← MERGE（y1，y2，…，yk） △ 合并子问题<br />
Return（T）<br />
其中 |P| 表示问题P的规模；n0为一阈值，表示当问题P的规模不超过n0时，问题已容易直接解出，不必再继续分解。ADHOC（P）是该分治法中的基本子算法，用于直接解小规模的问题P。因此，当P的规模不超过n0时，直接用算法ADHOC（P）求解。<br />
算法MERGE（y1，y2，…，yk）是该分治法中的合并子算法，用于将P的子问题P1、P2、…、Pk的相应的解y1、y2、…、yk合并为P的解。<br />
根 据分治法的分割原则，原问题应该分为多少个子问题才较适宜？各个子问题的规模应该怎样才为适当？这些问题很难予以肯定的回答。但人们从大量实践中发现，在 用分治法设计算法时，最好使子问题的规模大致相同。换句话说，将一个问题分成大小相等的k个子问题的处理方法是行之有效的。许多问题可以取k=2。这种使 子问题规模大致相等的做法是出自一种平衡子问题的思想，它几乎总是比子问题规模不等的做法要好。<br />
分治法的合并步骤是算法的关键所在。有些问题的合并方法比较明显，有些问题合并方法比较复杂，或者是有多种合并方案；或者是合并方案不明显。究竟应该怎样合并，没有统一的模式，需要具体问题具体分析。<br />
【问题】 大整数乘法<br />
问题描述：<br />
通常，在分析一个算法的计算复杂性时，都将加法和乘法运算当作是基本运算来处理，即将执行一次加法或乘法运算所需的计算时间当作一个仅取决于计算机硬件处理速度的常数。<br />
这 个假定仅在计算机硬件能对参加运算的整数直接表示和处理时才是合理的。然而，在某些情况下，我们要处理很大的整数，它无法在计算机硬件能直接表示的范围内 进行处理。若用浮点数来表示它，则只能近似地表示它的大小，计算结果中的有效数字也受到限制。若要精确地表示大整数并在计算结果中要求精确地得到所有位数 上的数字，就必须用软件的方法来实现大整数的算术运算。<br />
请设计一个有效的算法，可以进行两个n位大整数的乘法运算。<br />
设X和Y都是n位的二 进制整数，现在要计算它们的乘积XY。我们可以用小学所学的方法来设计一个计算乘积XY的算法，但是这样做计算步骤太多，显得效率较低。如果将每2个1位 数的乘法或加法看作一步运算，那么这种方法要作O(n2)步运算才能求出乘积XY。下面我们用分治法来设计一个更有效的大整数乘积算法。</p>
<p>图6-3 大整数X和Y的分段<br />
我们将n位的二进制整数X和Y各分为2段，每段的长为n/2位（为简单起见，假设n是2的幂），如图6-3所示。<br />
由此，X=A2n/2+B，Y=C2n/2+D。这样，X和Y的乘积为：<br />
XY=(A2n/2+B)(C2n/2+D)=AC2n+(AD+CB)2n/2+BD （1）<br />
如 果按式（1）计算XY，则我们必须进行4次n/2位整数的乘法(AC，AD，BC和BD)，以及3次不超过n位的整数加法（分别对应于式（1）中的加 号），此外还要做2次移位（分别对应于式（1）中乘2n和乘2n/2）。所有这些加法和移位共用O（n）步运算。设T（n）是2个n位整数相乘所需的运算 总数，则由式（1），我们有：<br />
（2）<br />
由此可得T（n）=O（n2）。因此，用（1）式来计算X和Y的乘积并不比小学生的方法更有效。要想改进算法的计算复杂性，必须减少乘法次数。为此我们把XY写成另一种形式：<br />
XY=AC2n+[(A-B)(D-C)+AC+BD]2n/2+BD （3）<br />
虽然，式（3）看起来比式（1）复杂些，但它仅需做3次n/2位整数的乘法（AC，BD和（A-B）（D-C）），6次加、减法和2次移位。由此可得：<br />
（4）<br />
用解递归方程的套用公式法马上可得其解为T(n)=O(nlog3)=O(n1.59)。利用式（3），并考虑到X和Y的符号对结果的影响，我们给出大整数相乘的完整算法MULT如下：<br />
function MULT(X，Y，n); {X和Y为2个小于2n的整数，返回结果为X和Y的乘积XY}<br />
begin<br />
S=SIGN(X)*SIGN(Y); {S为X和Y的符号乘积}<br />
X=ABS(X);<br />
Y=ABS(Y); {X和Y分别取绝对值}<br />
if n=1 then<br />
if (X=1)and(Y=1) then return(S)<br />
else return(0)<br />
else begin<br />
A=X的左边n/2位;<br />
B=X的右边n/2位;<br />
C=Y的左边n/2位;<br />
D=Y的右边n/2位;<br />
ml=MULT(A,C,n/2);<br />
m2=MULT(A-B,D-C,n/2);<br />
m3=MULT(B,D,n/2);<br />
S=S*(m1*2n+(m1+m2+m3)*2n/2+m3);<br />
return(S);<br />
end;<br />
end;<br />
上述二进制大整数乘法同样可应用于十进制大整数的乘法以提高乘法的效率减少乘法次数。<br />
【问题】 最接近点对问题<br />
问题描述：<br />
在 应用中，常用诸如点、圆等简单的几何对象代表现实世界中的实体。在涉及这些几何对象的问题中，常需要了解其邻域中其他几何对象的信息。例如，在空中交通控 制问题中，若将飞机作为空间中移动的一个点来看待，则具有最大碰撞危险的2架飞机，就是这个空间中最接近的一对点。这类问题是计算几何学中研究的基本问题 之一。下面我们着重考虑平面上的最接近点对问题。<br />
最接近点对问题的提法是：给定平面上n个点，找其中的一对点，使得在n个点的所有点对中，该点对的距离最小。<br />
严格地说，最接近点对可能多于1对。为了简单起见，这里只限于找其中的一对。<br />
这个问题很容易理解，似乎也不难解决。我们只要将每一点与其他n-1个点的距离算出，找出达到最小距离的两个点即可。然而，这样做效率太低，需要O(n2)的计算时间。我们能否找到问题的一个O (nlogn)算法。<br />
这 个问题显然满足分治法的第一个和第二个适用条件，我们考虑将所给的平面上n个点的集合S分成2个子集S1和S2，每个子集中约有n/2个点，然后在每个子 集中递归地求其最接近的点对。在这里，一个关键的问题是如何实现分治法中的合并步骤，即由S1和S2的最接近点对，如何求得原集合S中的最接近点对，因为 S1和S2的最接近点对未必就是S的最接近点对。如果组成S的最接近点对的2个点都在S1中或都在S2中，则问题很容易解决。但是，如果这2个点分别在 S1和S2中，则对于S1中任一点p，S2中最多只有n/2个点与它构成最接近点对的候选者，仍需做n2/4次计算和比较才能确定S的最接近点对。因此， 依此思路，合并步骤耗时为O(n2)。整个算法所需计算时间T(n)应满足：<br />
T(n)=2T(n/2)+O(n2)<br />
它的解为T(n)=O(n2)，即与合并步骤的耗时同阶，显示不出比用穷举的方法好。从解递归方程的套用公式法，我们看到问题出在合并步骤耗时太多。这启发我们把注意力放在合并步骤上。<br />
为 了使问题易于理解和分析，我们先来考虑一维的情形。此时S中的n个点退化为x轴上的n个实数x1、x2、…、xn。最接近点对即为这n个实数中相差最小的 2个实数。我们显然可以先将x1、x2、…、xn排好序，然后，用一次线性扫描就可以找出最接近点对。这种方法主要计算时间花在排序上，因此如在排序算法 中所证明的，耗时为O(nlogn)。然而这种方法无法直接推广到二维的情形。因此，对这种一维的简单情形，我们还是尝试用分治法来求解，并希望能推广到 二维的情形。<br />
假设我们用x轴上某个点m将S划分为2个子集S1和S2，使得S1={x∈S | x≤m}；S2={x∈S | x&gt;m}。这样一来，对于所有p∈S1和q∈S2有p<br />
递归地在S1和S2上找出其最接近点对{p1，p2}和{q1，q2}，并设δ=min{|p1-p2|，|q1-q2|}，S中的最接近点对或者是{p1，p2}，或者是{q1，q2}，或者是某个{p3，q3}，其中p3∈S1且q3∈S2。如图1所示。</p>
<p>图1 一维情形的分治法<br />
我 们注意到，如果S的最接近点对是{p3，q3}，即 | p3-q3 | &lt; δ，则p3和q3两者与m的距离不超过δ，即 | p3-m | &lt; δ，| q3-m | &lt; δ，也就是说，p3∈(m-δ，m)，q3∈(m，m+δ)。由于在S1中，每个长度为δ的半闭区间至多包含一个点（否则必有两点距离小于δ），并且m是 S1和S2的分割点，因此(m-δ，m)中至多包含S中的一个点。同理，(m，m+δ)中也至多包含S中的一个点。由图1可以看出，如果(m-δ，m)中 有S中的点，则此点就是S1中最大点。同理，如果(m，m+δ)中有S中的点，则此点就是S2中最小点。因此，我们用线性时间就能找到区间(m-δ，m) 和(m，m+δ)中所有点，即p3和q3。从而我们用线性时间就可以将S1的解和S2的解合并成为S的解。也就是说，按这种分治策略，合并步可在O(n) 时间内完成。这样是否就可以得到一个有效的算法了呢？<br />
还有一个问题需要认真考虑，即分割点m的选取，及S1和S2的划分。选取分割点m的一个基本 要求是由此导出集合S的一个线性分割，即S=S1∪S2 ，S1∩S2=Φ，且S1 {x | x≤m}；S2 {x | x&gt;m}。容易看出，如果选取m=[max（S）+min（S）]/2，可以满足线性分割的要求。选取分割点后，再用O(n)时间即可将S划分成 S1={x∈S | x≤m}和S2={x∈S | x&gt;m}。然而，这样选取分割点m，有可能造成划分出的子集S1和S2的不平衡。例如在最坏情况下，|S1|=1，|S2|=n-1，由此产生的分 治法在最坏情况下所需的计算时间T（n）应满足递归方程：<br />
T（n）=T（n-1）+O（n）<br />
它的解是T（n）=O（n2）。这种效率降低 的现象可以通过分治法中“平衡子问题”的方法加以解决。也就是说，我们可以通过适当选择分割点m，使S1和 S2中有大致相等个数的点。自然地，我们会想到用S的n个点的坐标的中位数来作分割点。在选择算法中介绍的选取中位数的线性时间算法使我们可以在O（n） 时间内确定一个平衡的分割点m。<br />
至此，我们可以设计出一个求一维点集S中最接近点对的距离的算法pair如下。<br />
Float pair（S）;<br />
{ if | S | =2 δ= | x[2]－x[1] | /*x[1..n]存放的是S中n个点的坐标*/<br />
else<br />
{ if ( | S | =1) δ=∞<br />
else<br />
{ m=S中各点的坐标值的中位数;<br />
构造S1和S2，使S1={x∈S | x≤m}，S2={x∈S | x＞m};<br />
δ1=pair(S1);<br />
δ2=pair(S2);<br />
p=max(S1);<br />
q=min(S2);<br />
δ=min(δ1，δ2，q-p);<br />
}<br />
return(δ);<br />
}<br />
由以上的分析可知，该算法的分割步骤和合并步骤总共耗时O(n)。因此，算法耗费的计算时间T(n)满足递归方程：</p>
<p>解此递归方程可得T(n)=O(nlogn)。</p>
<p>【问题】循环赛日程表<br />
问题描述：设有n=2k个运动员要进行网球循环赛。现要设计一个满足以下要求的比赛日程表：<br />
（1）每个选手必须与其他n-1个选手各赛一次；<br />
（2）每个选手一天只能参赛一次；<br />
（3）循环赛在n-1天内结束。<br />
请按此要求将比赛日程表设计成有n行和n-1列的一个表。在表中的第i行，第j列处填入第i个选手在第j天所遇到的选手。其中1≤i≤n，1≤j≤n-1。<br />
按分治策略，我们可以将所有的选手分为两半，则n个选手的比赛日程表可以通过n/2个选手的比赛日程表来决定。递归地用这种一分为二的策略对选手进行划分，直到只剩下两个选手时，比赛日程表的制定就变得很简单。这时只要让这两个选手进行比赛就可以了。</p>
<p>1 2 3 4 5 6 7<br />
1 2 3 4 5 6 7 8<br />
2 1 4 3 6 7 8 5<br />
3 4 1 2 7 8 5 6<br />
1 2 3 4 3 2 1 8 5 6 7<br />
1 2 3 4 5 6 7 8 1 4 3 2<br />
1 2 1 4 3 6 5 8 7 2 1 4 3<br />
1 2 3 4 1 2 7 8 5 6 3 2 1 4<br />
2 1 4 3 2 1 8 7 6 5 4 3 2 1<br />
（1） （2） （3）<br />
图1 2个、4个和8个选手的比赛日程表<br />
图1 所列出的正方形表（3）是8个选手的比赛日程表。其中左上角与左下角的两小块分别为选手1至选手4和选手5至选手8前3天的比赛日程。据此，将左上角小块 中的所有数字按其相对位置抄到右下角，又将左下角小块中的所有数字按其相对位置抄到右上角，这样我们就分别安排好了选手1至选手4和选手5至选手8在后4 天的比赛日程。依此思想容易将这个比赛日程表推广到具有任意多个选手的情形。<br />
八、动态规划法</p>
<p>经常会遇到复杂问题不能简单地分解成几个子问题，而会分解出一系列的子问题。简单地采用把大问题分解成子问题，并综合子问题的解导出大问题的解的方法，问题求解耗时会按问题规模呈幂级数增加。<br />
为了节约重复求相同子问题的时间，引入一个数组，不管它们是否对最终解有用，把所有子问题的解存于该数组中，这就是动态规划法所采用的基本方法。以下先用实例说明动态规划方法的使用。<br />
【问题】 求两字符序列的最长公共字符子序列<br />
问 题描述：字符序列的子序列是指从给定字符序列中随意地（不一定连续）去掉若干个字符（可能一个也不去掉）后所形成的字符序列。令给定的字符序列X= “x0，x1，…，xm-1”，序列Y=“y0，y1，…，yk-1”是X的子序列，存在X的一个严格递增下标序列，使得对所有的j=0，1，…，k- 1，有xij=yj。例如，X=“ABCBDAB”，Y=“BCDB”是X的一个子序列。<br />
给定两个序列A和B，称序列Z是A和B的公共子序列，是指Z同是A和B的子序列。问题要求已知两序列A和B的最长公共子序列。<br />
如采用列举A的所有子序列，并一一检查其是否又是B的子序列，并随时记录所发现的子序列，最终求出最长公共子序列。这种方法因耗时太多而不可取。<br />
考虑最长公共子序列问题如何分解成子问题，设A=“a0，a1，…，am-1”，B=“b0，b1，…，bm-1”，并Z=“z0，z1，…，zk-1”为它们的最长公共子序列。不难证明有以下性质：<br />
（1） 如果am-1=bn-1，则zk-1=am-1=bn-1，且“z0，z1，…，zk-2”是“a0，a1，…，am-2”和“b0，b1，…，bn-2”的一个最长公共子序列；<br />
（2） 如果am-1!=bn-1，则若zk-1!=am-1，蕴涵“z0，z1，…，zk-1”是“a0，a1，…，am-2”和“b0，b1，…，bn-1”的一个最长公共子序列；<br />
（3） 如果am-1!=bn-1，则若zk-1!=bn-1，蕴涵“z0，z1，…，zk-1”是“a0，a1，…，am-1”和“b0，b1，…，bn-2”的一个最长公共子序列。<br />
这 样，在找A和B的公共子序列时，如有am-1=bn-1，则进一步解决一个子问题，找“a0，a1，…，am-2”和“b0，b1，…，bm-2”的一个 最长公共子序列；如果am-1!=bn-1，则要解决两个子问题，找出“a0，a1，…，am-2”和“b0，b1，…，bn-1”的一个最长公共子序列 和找出“a0，a1，…，am-1”和“b0，b1，…，bn-2”的一个最长公共子序列，再取两者中较长者作为A和B的最长公共子序列。<br />
定义c[i][j]为序列“a0，a1，…，ai-2”和“b0，b1，…，bj-1”的最长公共子序列的长度，计算c[i][j]可递归地表述如下：<br />
（1）c[i][j]=0 如果i=0或j=0；<br />
（2）c[i][j]= c[i-1][j-1]+1 如果I，j&gt;0，且a[i-1]=b[j-1]；<br />
（3）c[i][j]=max（c[i][j-1]，c[i-1][j]） 如果I，j&gt;0，且a[i-1]!=b[j-1]。<br />
按此算式可写出计算两个序列的最长公共子序列的长度函数。由于c[i][j]的产生仅依赖于c[i-1][j-1]、c[i-1][j]和c[i][j-1]，故可以从c[m][n]开始，跟踪c[i][j]的产生过程，逆向构造出最长公共子序列。细节见程序。<br />
# include<br />
# include<br />
# define N 100<br />
char a[N],b[N],str[N];</p>
<p>int lcs_len(char *a, char *b, int c[ ][ N])<br />
{ int m=strlen(a), n=strlen(b), i,j;<br />
for (i=0;i&lt;=m;i++) c[i][0]=0;<br />
for (i=0;i&lt;=n;i++) c[0][i]=0;<br />
for (i=1;i&lt;=m;i++)<br />
for (j=1;j&lt;=m;j++)<br />
if (a[i-1]==b[j-1])<br />
c[i][j]=c[i-1][j-1]+1;<br />
else if (c[i-1][j]&gt;=c[i][j-1])<br />
c[i][j]=c[i-1][j];<br />
else<br />
c[i][j]=c[i][j-1];<br />
return c[m][n];<br />
}</p>
<p>char *buile_lcs(char s[ ],char *a, char *b)<br />
{ int k, i=strlen(a), j=strlen(b);<br />
k=lcs_len(a,b,c);<br />
s[k]=’\0’;<br />
while (k&gt;0)<br />
if (c[i][j]==c[i-1][j]) i&#8211;;<br />
else if (c[i][j]==c[i][j-1]) j&#8211;;<br />
else { s[--k]=a[i-1];<br />
i&#8211;; j&#8211;;<br />
}<br />
return s;<br />
}</p>
<p>void main()<br />
{ printf (“Enter two string（&lt;%d）!\n”,N);<br />
scanf(“%s%s”,a,b);<br />
printf(“LCS=%s\n”,build_lcs(str,a,b));<br />
}<br />
1、动态规划的适用条件<br />
任何思想方法都有一定的局限性，超出了特定条件，它就失去了作用。同样，动态规划也并不是万能的。适用动态规划的问题必须满足最优化原理和无后效性。<br />
（1）最优化原理（最优子结构性质）<br />
最优化原理可这样阐述：一个最优化策略具有这样的性质，不论过去状态和决策如何，对前面的决策所形成的状态而言，余下的诸决策必须构成最优策略。简而言之，一个最优化策略的子策略总是最优的。一个问题满足最优化原理又称其具有最优子结构性质。</p>
<p>图2<br />
例如图2中，若路线I和J是A到C的最优路径，则根据最优化原理，路线J必是从B到C的最优路线。这可用反证法证明：假设有另一路径J’是B到C的最优路径，则A到C的路线取I和J’比I和J更优，矛盾。从而证明J’必是B到C的最优路径。<br />
最优化原理是动态规划的基础，任何问题，如果失去了最优化原理的支持，就不可能用动态规划方法计算。根据最优化原理导出的动态规划基本方程是解决一切动态规划问题的基本方法。<br />
（2）无后向性<br />
将各阶段按照一定的次序排列好之后，对于某个给定的阶段状态，它以前各阶段的状态无法直接影响它未来的决策，而只能通过当前的这个状态。换句话说，每个状态都是过去历史的一个完整总结。这就是无后向性，又称为无后效性。<br />
（3）子问题的重叠性<br />
动 态规划算法的关键在于解决冗余，这是动态规划算法的根本目的。动态规划实质上是一种以空间换时间的技术，它在实现的过程中，不得不存储产生过程中的各种状 态，所以它的空间复杂度要大于其它的算法。选择动态规划算法是因为动态规划算法在空间上可以承受，而搜索算法在时间上却无法承受，所以我们舍空间而取时 间。<br />
所以，能够用动态规划解决的问题还有一个显著特征：子问题的重叠性。这个性质并不是动态规划适用的必要条件，但是如果该性质无法满足，动态规划算法同其他算法相比就不具备优势。<br />
2、动态规划的基本思想<br />
前 文主要介绍了动态规划的一些理论依据，我们将前文所说的具有明显的阶段划分和状态转移方程的动态规划称为标准动态规划，这种标准动态规划是在研究多阶段决 策问题时推导出来的，具有严格的数学形式，适合用于理论上的分析。在实际应用中，许多问题的阶段划分并不明显，这时如果刻意地划分阶段法反而麻烦。一般来 说，只要该问题可以划分成规模更小的子问题，并且原问题的最优解中包含了子问题的最优解（即满足最优子化原理），则可以考虑用动态规划解决。<br />
动态规划的实质是分治思想和解决冗余，因此，动态规划是一种将问题实例分解为更小的、相似的子问题，并存储子问题的解而避免计算重复的子问题，以解决最优化问题的算法策略。<br />
由 此可知，动态规划法与分治法和贪心法类似，它们都是将问题实例归纳为更小的、相似的子问题，并通过求解子问题产生一个全局最优解。其中贪心法的当前选择可 能要依赖已经作出的所有选择，但不依赖于有待于做出的选择和子问题。因此贪心法自顶向下，一步一步地作出贪心选择；而分治法中的各个子问题是独立的（即不 包含公共的子子问题），因此一旦递归地求出各子问题的解后，便可自下而上地将子问题的解合并成问题的解。但不足的是，如果当前选择可能要依赖子问题的解 时，则难以通过局部的贪心策略达到全局最优解；如果各子问题是不独立的，则分治法要做许多不必要的工作，重复地解公共的子问题。<br />
解决上述问题的办 法是利用动态规划。该方法主要应用于最优化问题，这类问题会有多种可能的解，每个解都有一个值，而动态规划找出其中最优（最大或最小）值的解。若存在若干 个取最优值的解的话，它只取其中的一个。在求解过程中，该方法也是通过求解局部子问题的解达到全局最优解，但与分治法和贪心法不同的是，动态规划允许这些 子问题不独立，（亦即各子问题可包含公共的子子问题）也允许其通过自身子问题的解作出选择，该方法对每一个子问题只解一次，并将结果保存起来，避免每次碰 到时都要重复计算。<br />
因此，动态规划法所针对的问题有一个显著的特征，即它所对应的子问题树中的子问题呈现大量的重复。动态规划法的关键就在于，对于重复出现的子问题，只在第一次遇到时加以求解，并把答案保存起来，让以后再遇到时直接引用，不必重新求解。<br />
3、动态规划算法的基本步骤<br />
设计一个标准的动态规划算法，通常可按以下几个步骤进行：<br />
（1）划分阶段：按照问题的时间或空间特征，把问题分为若干个阶段。注意这若干个阶段一定要是有序的或者是可排序的（即无后向性），否则问题就无法用动态规划求解。<br />
（2）选择状态：将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然，状态的选择要满足无后效性。<br />
（3） 确定决策并写出状态转移方程：之所以把这两步放在一起，是因为决策和状态转移有着天然的联系，状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。 所以，如果我们确定了决策，状态转移方程也就写出来了。但事实上，我们常常是反过来做，根据相邻两段的各状态之间的关系来确定决策。<br />
（4）写出规划方程（包括边界条件）：动态规划的基本方程是规划方程的通用形式化表达式。<br />
一般说来，只要阶段、状态、决策和状态转移确定了，这一步还是比较简单的。动态规划的主要难点在于理论上的设计，一旦设计完成，实现部分就会非常简单。根据动态规划的基本方程可以直接递归计算最优值，但是一般将其改为递推计算，实现的大体上的框架如下：<br />
标准动态规划的基本框架<br />
1. 对fn+1(xn+1)初始化; {边界条件}<br />
for k:=n downto 1 do<br />
for 每一个xk∈Xk do<br />
for 每一个uk∈Uk(xk) do<br />
begin<br />
5. fk(xk):=一个极值; {∞或－∞}<br />
6. xk+1:=Tk(xk,uk); {状态转移方程}<br />
7. t:=φ(fk+1(xk+1),vk(xk,uk)); {基本方程(9)式}<br />
if t比fk(xk)更优 then fk(xk):=t; {计算fk(xk)的最优值}<br />
end;<br />
9. t:=一个极值; {∞或－∞}<br />
for 每一个x1∈X1 do<br />
11. if f1(x1)比t更优 then t:=f1(x1); {按照10式求出最优指标}<br />
12. 输出t;<br />
但是，实际应用当中经常不显式地按照上面步骤设计动态规划，而是按以下几个步骤进行：<br />
（1）分析最优解的性质，并刻划其结构特征。<br />
（2）递归地定义最优值。<br />
（3）以自底向上的方式或自顶向下的记忆化方法（备忘录法）计算出最优值。<br />
（4）根据计算最优值时得到的信息，构造一个最优解。<br />
步 骤（1）～（3）是动态规划算法的基本步骤。在只需要求出最优值的情形，步骤（4）可以省略，若需要求出问题的一个最优解，则必须执行步骤（4）。此时， 在步骤（3）中计算最优值时，通常需记录更多的信息，以便在步骤（4）中，根据所记录的信息，快速地构造出一个最优解。</p>
<p>【问题】 凸多边形的最优三角剖分问题<br />
问 题描述：多边形是平面上一条分段线性的闭曲线。也就是说，多边形是由一系列首尾相接的直线段组成的。组成多边形的各直线段称为该多边形的边。多边形相接两 条边的连接点称为多边形的顶点。若多边形的边之间除了连接顶点外没有别的公共点，则称该多边形为简单多边形。一个简单多边形将平面分为3个部分：被包围在 多边形内的所有点构成了多边形的内部；多边形本身构成多边形的边界；而平面上其余的点构成了多边形的外部。当一个简单多边形及其内部构成一个闭凸集时，称 该简单多边形为凸多边形。也就是说凸多边形边界上或内部的任意两点所连成的直线段上所有的点均在该凸多边形的内部或边界上。<br />
通常，用多边形顶点的逆时针序列来表示一个凸多边形，即P=表示具有n条边v0v1，v1v2，…，vn-1vn的一个凸多边形，其中，约定v0=vn 。<br />
若vi与vj是多边形上不相邻的两个顶点，则线段vivj称为多边形的一条弦。弦将多边形分割成凸的两个子多边形和。多边形的三角剖分是一个将多边形分割成互不重迭的三角形的弦的集合T。图1是一个凸多边形的两个不同的三角剖分。</p>
<p>(a) (b)<br />
图1 一个凸多边形的2个不同的三角剖分<br />
在凸多边形P的一个三角剖分T中，各弦互不相交且弦数已达到最大，即P的任一不在T中的弦必与T中某一弦相交。在一个有n个顶点的凸多边形的三角刮分中，恰好有n-3条弦和n-2个三角形。<br />
凸多边形最优三角剖分的问题是：给定一个凸多边形P=以及定义在由多边形的边和弦组成的三角形上的权函数ω。要求确定该凸多边形的一个三角剖分，使得该三角剖分对应的权即剖分中诸三角形上的权之和为最小。<br />
可以定义三角形上各种各样的权函数ω。例如：定义ω(△vivjvk)=| vivj |+| vivk |+| vkvj |，其中，| vivj |是点vi到vj的欧氏距离。相应于此权函数的最优三角剖分即为最小弦长三角剖分。<br />
（1）最优子结构性质<br />
凸 多边形的最优三角剖分问题有最优子结构性质。事实上，若凸（n+1）边形P=的一个最优三角剖分T包含三角形v0vkvn，1≤k≤n-1，则T的权为3 个部分权的和，即三角形v0vkvn的权，子多边形 的权和的权之和。可以断言由T所确定的这两个子多边形的三角剖分也是最优的，因为若有或的更小权的三角剖分，将会导致T不是最优三角剖分的矛盾。<br />
（2）最优三角剖分对应的权的递归结构<br />
首先，定义t[i，j]（1≤i的最优三角剖分所对应的权值，即最优值。为方便起见，设退化的多边形具有权值0。据此定义，要计算的凸（n+1）边多边形P对应的权的最优值为t[1，n]。<br />
t[i， j]的值可以利用最优子结构性质递归地计算。由于退化的2顶点多边形的权值为0，所以t[i，i]=0，i=1，2，…，n 。当j一i≥1时，子多边形至少有3个顶点。由最优于结构性质，t[i，j]的值应为t[i，k]的值加上t [k+1，j]的值，再加上△vi-1vkvj的权值，并在i≤k≤j-1的范围内取最小。由此，t[i，j]可递归地定义为：</p>
<p>（3）计算最优值<br />
下 面描述的计算凸（n+1）边形P=的三角剖分最优权值的动态规划算法MINIMUM_WEIGHT，输入是凸多边形P=的权函数ω，输出是最优值t[i， j]和使得t[i，k]+t[k+1，j]+ω（△vi-1vkvj）达到最优的位置（k=）s[i，j]，1≤i≤j≤n 。<br />
Procedure MINIMUM_WEIGHT(P，w)；<br />
Begin<br />
n=length[p]-1;<br />
for i=1 to n do t[i,i]:=0;<br />
for ll=2 to n do<br />
for i=1 to n-ll+1 do<br />
begin<br />
j=i+ll-1;<br />
t[i,j]=∞;<br />
for k=i to j-1 do<br />
begin<br />
q=t[i,k]+t[k+1,j]+ω(△vi-1vkvj);<br />
if q<br />
begin<br />
t[i,j]=q;<br />
s[i,j]=k;<br />
end;<br />
end;<br />
end;<br />
return(t,s);<br />
end;<br />
算法MINIMUM_WEIGHT_占用θ(n2)空间，耗时θ(n3)。<br />
（4）构造最优三角剖分<br />
如 我们所看到的，对于任意的1≤i≤j≤n ，算法MINIMUM_WEIGHT在计算每一个子多边形的最优三角剖分所对应的权值t[i，j]的同时，还在 s[i，j]中记录了此最优三角剖分中与边（或弦）vi-1vj构成的三角形的第三个顶点的位置。因此，利用最优子结构性质并借助于s[i，j]， 1≤i≤j≤n ，凸（n+l）边形P=的最优三角剖分可容易地在Ο(n)时间内构造出来。</p>
<p>习题：<br />
1、汽车加油问题：<br />
设有路程长度为L公里的公路上，分布着m个加油站，它们的位置分别为p[i]（i=1，2，……，m），而汽车油箱加满油后（油箱最多可以加油k升），可以行驶n公里。设计一个方案，使汽车经过此公路的加油次数尽量少（汽车出发时是加满油的）。<br />
2、最短路径：<br />
设有一个网络，要求从某个顶点出发到其他顶点的最短路径<br />
3、跳马问题：<br />
在8*8方格的棋盘上，从任意指定的方格出发，为马寻找一条走遍棋盘每一格并且只经过一次的一条路径。<br />
4、二叉树的遍历<br />
5、背包问题<br />
6、用分治法实现两个大整数相乘<br />
7、设x1，x2，…，xn是直线上的n个点，若要用单位长度的闭区间去覆盖这n个点，至少需要多少个这样的单位闭区间？<br />
8、用关系“＜”和“＝”将3个数A、B和C依次排列时，有13种不同的序关系：<br />
A＝B＝C，A＝B＜C，A＜B＝C，A＜B＜C，A＜C＜B，A＝C＜B，B＜A＝C，<br />
B＜A＜C，B＜C＜A，B＝C＜A，C＜A＝B，C＜A＜B，C＜A＜B。<br />
若要将n个数依序进行排列，试设计一个动态规划算法，计算出有多少钟不同的序关系。<br />
9、有一种单人玩的游戏：设有n(2&lt;=n&lt;=200)堆薄片，各堆顺序用0至 n-1编号，极端情况，有的堆可能没有薄片。在游戏过程中，一次移动只能取某堆上的若干张薄片，移到该堆的相邻堆上。如指定<br />
I堆k张 k 移到I-1(I&gt;0)堆，和将k 张薄片移至I+1(I<br />
游戏的目标是对给定的堆数，和各堆上的薄片数，按上述规则移动薄片，最终使 各堆的薄片数相同。为了使移动次数较少些，移动哪一堆薄片，和移多少薄片先作以下估算：<br />
设<br />
ci:I堆的薄片数(0&lt;=I&lt;=ci&lt;=200);<br />
v：每堆 的平均薄片数；<br />
ai:I堆的相邻堆可以从I堆得到的薄片数。<br />
估算方法如下：<br />
v=c0+a1-a0 a1=v+a0-c0<br />
v=c1+a0+a2-2a1 a2=v+2a1-a0-c1<br />
…….. ……….<br />
V=ci+ai-1+ai+1-2aI ai+1=v+2ai-ai-1-ci<br />
这里并不希望准确地求出A0 至an-1，而是作以下处理：若令 a0 为0，能按上述算式计算出 A1至 an-1。程序找出 a 中的最小值，并让全部a值减去这最小值，使每堆移去的薄片数大于等于0。<br />
实际操作采用以下贪心策略：<br />
（1） 每次从第一堆出发顺序搜索每一堆，若发现可从 I堆移走薄片，就完成一次移动。即， I堆的相邻堆从 I堆取走 ai片薄片。可从I 堆移薄片到相邻堆取于 I堆薄片数：若I 堆是处于两端位置( I=0 I=n-1), 要求 ci&gt;=ai ；若 I堆是中间堆，则要求ci&gt;=2ai。<br />
（2）因在ai&gt;0的所有堆中，薄片数最多的堆 在平分过程中被它的相邻堆取走的薄片数也最多。在用策略（1）搜索移动时，当发生没有满足条件（1）的可移走薄片的堆时，采用本策略，让在ai&gt;0的所有堆中，薄片数最多的堆被它的相邻堆取走它的全部薄片。</p>
<hr/><p style="font-size:1.5em;font-weight:bold;">推荐阅读</p><p><i>2005.04.09.8:15.pm</i>.&nbsp;<a href="http://www.thinkagain.cn/archives/31.html" title="Google的PageRank算法学习1.2.3,网上转载的。做seo的可以看看吧。

Google的PageRa">Google的PageRank算法学习 (1)</a></p><hr/><p>Copyright &copy; 2012&nbsp;|&nbsp;<a href="http://www.thinkagain.cn">Think Again</a>&nbsp;|&nbsp;<a href="http://www.thinkagain.cn/archives/43.html">原文链接</a></p><img src="http://img.tongji.cn.yahoo.com/710673/ystat.gif"/>]]></content:encoded>
			<wfw:commentRss>http://www.thinkagain.cn/archives/43.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google的PageRank算法学习</title>
		<link>http://www.thinkagain.cn/archives/31.html</link>
		<comments>http://www.thinkagain.cn/archives/31.html#comments</comments>
		<pubDate>Sun, 10 Apr 2005 04:15:28 +0000</pubDate>
		<dc:creator>山之岚</dc:creator>
				<category><![CDATA[Google]]></category>
		<category><![CDATA[算法]]></category>
		<category><![CDATA[PageRank]]></category>

		<guid isPermaLink="false">http://lovepc.i-lady.cn/archives/31</guid>
		<description><![CDATA[Google的PageRank算法学习1.2.3,网上转载的。做seo的可以看看吧。 Google的PageRank算法学习一 1、Google PageRank(网页级别)介绍 Google的核心软件称为 PageRank(网页级别)，这是由Google创始人 Larry Page 和 Sergey ... ]]></description>
			<content:encoded><![CDATA[<p>Google的PageRank算法学习1.2.3,网上转载的。做seo的可以看看吧。</p>
<p><strong>Google的PageRank算法学习一<br />
</strong>1、Google PageRank(网页级别)介绍<br />
Google的核心软件称为 PageRank(网页级别)，这是由Google创始人 Larry Page 和 Sergey Brin 在斯坦福大学开发出的一套用于网页评级的系统，网页级别(PageRank)是所有Google网络搜索工具的基础。<br />
作 为组织管理工具，网页级别(PageRank)利用了互联网独特的民主特性及其巨大的链接结构。实质上，当从网页 A 链接到网页 B 时，Google 就认为&#8221;网页 A 投了网页 B 一票&#8221;。Google 根据网页的得票数评定其重要性。然而，除了考虑网页得票数（即链接）的纯数量之外，Google 还要分析投票的网页。&#8221;重要&#8221;的网页所投出的票就会有更高的权重，并且有助于提高其它网页的&#8221;重要性&#8221;。重要的、高质量的网页会获得较高的网页级别。 Google 在排列其搜索结果时，都会考虑每个网页的级别(PageRank)。当然，如果不能满足您的查询要求，网页级别(PageRank)再高对您来说也毫无意 义。因此，Google 将网页级别(PageRank)与完善的文本匹配技术结合在一起，为您找到最重要、最有用的网页。Google 所关注的远不只是关键词在网页上出现的次数，它还对该网页的内容（以及该网页所链接的内容）进行全面检查，从而确定该网页是否满足您的查询要求。 Google 以其复杂而全自动的搜索方法排除了任何人为因素对搜索结果的影响。虽然Google也在搜索结果旁刊登相关广告，但没人能花钱买到更高的网页级别 (PageRank)，从而保证了网页排名的客观公正。</p>
<p>google自己对于pagerank的解释如下：<br />
PageRank Explained<br />
PageRank relies on the uniquely democratic nature of the web by using its vast link structure as an indicator of an individual page&#8217;s value.In essence, Google interprets a link from page A to page B as a vote, by page A, for page B. But, Google looks at more than the sheer volume of votes, or links a page receives; it also analyzes the page that casts the vote. Votes cast by pages that are themselves &#8220;important&#8221; weigh more heavily and help to make other pages &#8220;important.&#8221;<br />
Important, high-quality sites receive a higher PageRank, which Google remembers each time it conducts a search. Of course, important pages mean nothing to you if they don&#8217;t match your query. So, Google combines PageRank with sophisticated text-matching techniques to find pages that are both important and relevant to your search. Google goes far beyond the number of times a term appears on a page and examines all aspects of the page&#8217;s content (and the content of the pages linking to it) to determine if it&#8217;s a good match for your query.</p>
<p>返回顶端</p>
<p>2、PageRank算法1<br />
PR(A) = (1-d) + d (PR(T1)/C(T1) + &#8230; + PR(Tn)/C(Tn))<br />
其中：PR(A):页面A的网页级别,<br />
PR(Ti)：页面Ti的网页级别，页面Ti链向页面A，<br />
C(Ti)：页面Ti链出的链接数量，<br />
d：阻尼系数，取值在0－1之间.</p>
<p>由 此可见，1）这个算法不以站点排序，页面网页级别由一个个独立的页面决定；2）页面的网页级别由链向它的页面的网页级别决定，但每个链入页面的贡献的值是 不同的。如果Ti页面中链出越多，它对当前页面A的贡献就越小。A的链入页面越多，其网页级别也越高；3）阻尼系数的使用，减少了其它页面对当前页面A的 排序贡献。</p>
<p>返回顶端</p>
<p>3、随机冲浪模型<br />
Lawrence Page 和 Sergey Brin 提出了用户行为的随机冲浪模型，来解释上述算法。他们把用户点击链接的行为，视为一种不关心内容的随机行为。而用户点击页面内的链接的概率，完全由页面上 链接数量的多少决定的，这也是上面PR(Ti)/C(Ti)的原因。一个页面通过随机冲浪到达的概率就是链入它的别的页面上的链接的被点击概率的和。阻尼 系数d的引入，是因为用户不可能无限的点击链接，常常因劳累而随机跳入另一个页面。d可以视为用户无限点击下去的概率，（1－d）则就是页面本身所具有的 网页级别。</p>
<p>返回顶端</p>
<p>4、PageRank算法2（对算法1的修订）<br />
PR(A) = (1-d) / N + d (PR(T1)/C(T1) + &#8230; + PR(Tn)/C(Tn))<br />
其中N是互联网上所有网页的数量</p>
<p>由此，所有页面的网页级别形成的一个概率分布，所有页面的网页级别之和是1。在算法1中，随机冲浪访问某个页面的概率由互联网的总页数决定，在算法2中，网页级别是一个页面被随机访问的期望值。<br />
以下讲解，皆基于算法1，主要是计算简单，因为不用考虑N的值。</p>
<p>返回顶端</p>
<p>5、PageRank的特性<br />
有页面的网页级别之和等于互联网的总页数。在网页数比较少的情况下，网页级别方程可以解出，而面对互联网上成亿的网页，再解方程是不可能的。</p>
<p>此处设阻尼系数为0.5，虽然Lawrence Page 和 Sergey Brin在实际将其设为0.85.<br />
PR(A) = 0.5 + 0.5 PR(C)<br />
PR(B) = 0.5 + 0.5 (PR(A) / 2)<br />
PR(C) = 0.5 + 0.5 (PR(A) / 2 + PR(B))<br />
解得：<br />
PR(A) = 14/13 = 1.07692308<br />
PR(B) = 10/13 = 0.76923077<br />
PR(C) = 15/13 = 1.15384615<br />
有：<br />
PR(A)+PR(B)+PR(C)=3</p>
<p>返回顶端</p>
<p>6、迭代计算pagerank<br />
Google 采用一种近似的迭代的方法计算网页的网页级别的，也就是先给每个网页一个初始值，然后利用上面的公式，循环进行有限次运算得到近似的网页级别。根据 Lawrence Page 和 Sergey Brin公开发表的文章，他们实际需要进行100次迭代才能得到整个互联网的满意的网页级别值，这儿的例子只用了10多次就可以了。在迭代的过程中，每个 网页的网页级别的和是收敛于整个网络的页面数的。所以，每个页面的平均网页级别是1，实际上的值在（1－d）和(dN+(1-d))之间。</p>
<p>迭代次数<br />
PR(A)<br />
PR(B)<br />
PR(C)</p>
<p>0<br />
1<br />
1<br />
1</p>
<p>1<br />
1<br />
0.75<br />
1.125</p>
<p>2<br />
1.0625<br />
0.765625<br />
1.1484375</p>
<p>3<br />
1.07421875<br />
0.76855469<br />
1.15283203</p>
<p>4<br />
1.07641602<br />
0.76910400<br />
1.15365601</p>
<p>5<br />
1.07682800<br />
0.76920700<br />
1.15381050</p>
<p>6<br />
1.07690525<br />
0.76922631<br />
1.15383947</p>
<p>7<br />
1.07691973<br />
0.76922993<br />
1.15384490</p>
<p>8<br />
1.07692245<br />
0.76923061<br />
1.15384592</p>
<p>9<br />
1.07692296<br />
0.76923074<br />
1.15384611</p>
<p>10<br />
1.07692305<br />
0.76923076<br />
1.15384615</p>
<p>11<br />
1.07692307<br />
0.76923077<br />
1.15384615</p>
<p>12<br />
1.07692308<br />
0.76923077<br />
1.15384615</p>
<p>返回顶端</p>
<p>7、Google搜索引擎的网页级别的实现<br />
有三个因素决定的网页的等级：网页特定性因素、入链锚的文本、网页级别。<br />
网页特定性因素包括网页的内容、标题及URL等。<br />
为提供检索结果，Google根据网页特定性因素和入链锚的文本计算出网页的IR值，这个值被检索项在页面中的位置和重要性加权，以决定网页和检索请求相关性。IR值和网页级别联合标志网页的基本重要程度，这两个值的联合方式有多种，但明显的是不能相加的。<br />
由于网页级别只对非特定的单个词的检索请求影响比较明显，对于由多个检索词构成的检索请求，内容相关性的分级标准的影响更大。</p>
<p>返回顶端</p>
<p>8、用Google工具条显示当前页面的网页级别(PAGERANK)<br />
Google工具条是Google公司开发的IE插件，需要从Google下载并安装。注意，显示网页级别的功能是其高级功能，这时会自动收集用户的信息，并会自动升级工具条。<br />
这个工具条显示的网页级别分为0－10共11级，如果根据理论用(Nd+(1-d))测算，假定d=0.85,则推测实际网级别的对数即为显示的级别，且对数的基数在6-7之间。<br />
参考文献1中给出了一个方法，可以不经过toolbar就可以取得网站主页的网页级别，可惜因为版本或别的原因，已经不可行。下面我根据提示在IE缓冲目录里找到<a href="http://xagoogle.com/" target="_blank">http://xagoogle.com</a>的获取URL.</p>
<p><a href="http://216.239.33.104/search?cli" target="_blank">http://216.239.33.104/search?cli</a> &#8230; ong%2E3322%2Eorg%2F</p>
<p>我的主页的网页级别是0。 isaac和chedong的分别是5和4。</p>
<p>返回顶端</p>
<p>9、Google的目录服务可以显示网站的pagerank<br />
此处级别分为7级。有人对两种级别进行了比较</p>
<p><strong>PageRank算法学习&lt;二&gt;</strong></p>
<p>1、入链对计算页面级别的影响<br />
入链总是能增加当前页面的级别，尤其当前页与其下级页面构成回路时，这种贡献更大。如右图例，设ABCD各页初始级别为1，阻尼系数为0.5，PR(X)/C(X)＝10。则易算出</p>
<p>PR(A) = 19/3 = 6.33<br />
PR(B) = 11/3 = 3.67<br />
PR(C) = 7/3 = 2.33<br />
PR(D) = 5/3 = 1.67</p>
<p>如果A不在回路上，则只能得0.5*10=5的收益。<br />
阻尼系数越大，页面级别的收益越大，且整个回路上都能收到更大的收益（即入链收益更能平均地分布到各个回路页面上。针对上例，将阻尼系数改为0.75，则有</p>
<p>PR(A) = 419/35 = 11.97<br />
PR(B) = 323/35 = 9.23<br />
PR(C) = 251/35 = 7.17<br />
PR(D) = 197/35 = 5.63</p>
<p>除回路上各个页面的级别值明显增大外，PR(A)/PR(D)的值敢明显减少了。<br />
入链对整个回路上所有页面的级别值的增加之和，可以由下面这个公式得出.</p>
<p>(d / (1-d)) × (PR(X) / C(X))</p>
<p>这个公式，可以由简单推导出。</p>
<p>返回顶端<br />
2、出链对计算页面级别(pagerank)的影响<br />
增加出链不会影响整个web的总级别，但一个站点失去的级别值等于链到的站点的增加值之和。对于两个封闭的站点，从一个站点链上另一个站点时，增加的和 减少的都是(d(/(1-d) × (PR(X) / C(X)).如果这两个站点互相链接，则此值减少。用随机冲浪模型可以解释这种现象，就是出链的增加，减少了用户访问站内页面的概率。举例如图，设阻尼系 数为0.75，则</p>
<p>PR(A) = 0.25 + 0.75 PR(B)<br />
PR(B) = 0.25 + 0.375 PR(A)<br />
PR(C) = 0.25 + 0.75 PR(D) + 0.375 PR(A)<br />
PR(D) = 0.25 + 0.75 PR(C)<br />
得：<br />
PR(A) = 14/23<br />
PR(B) = 11/23<br />
PR(C) = 35/23<br />
PR(D) = 32/23<br />
PR(A)+PR(B)=25/23<br />
PR(C)+PR(D)=67/23<br />
PR(A)+PR(B)+PR(C)+PR(D)=92/23=4</p>
<p>Page和Brin将这样的链接称为悬摆链，它链到页面没有出链。悬摆链对页面的级别计算产生负面影响。如例，阻尼系数为0.75.</p>
<p>PR(A) = 0.25 + 0.75 PR(B)<br />
PR(B) = 0.25 + 0.375 PR(A)<br />
PR(C) = 0.25 + 0.375 PR(A)<br />
得：<br />
PR(A) = 14/23<br />
PR(B) = 11/23<br />
PR(C) = 11/23<br />
PR(A)+PR(B)+PR(C)=36/23&lt;3</p>
<p>据Page和Brin，Google在索引页面时，悬摆链的量很大，主要是由于限制robot.txt的限制及索引了一些没有链出的文件类型如PDF 等。为消除这种负面影响，google在计算级别时，将此类链接从数据库里去掉，在计算完毕后，再单独计算悬摆链所链到页面。由此可见，PDF类的文件还 是可以放心地在网上发布的。</p>
<p>、页面数量对pagerank的影响</p>
<p>先看例子。阻尼系数为0.75,PR(X)/C(X)=10,则</p>
<p>PR(A) = 0.25 + 0.75 (10 + PR(B) + PR(C))<br />
PR(B) = PR(C) = 0.25 + 0.75 (PR(A) / 2)<br />
得：<br />
PR(A) = 260/14<br />
PR(B) = 101/14<br />
PR(C) = 101/14<br />
PR(A)+PR(B)+PR(C)=33;<br />
增加页面D；<br />
PR(A) = 0.25 + 0.75 (10 + PR(B) + PR(C) + PR(D))<br />
PR(B) = PR(C) = PR(D) = 0.25 + 0.75 (PR(A) / 3)<br />
得<br />
PR(A) = 266/14<br />
PR(B) = 70/14<br />
PR(C) = 70/14<br />
PR(D) = 70/14<br />
PR(A)+PR(B)+PR(C)+PR(D)=34</p>
<p>增加页面后，所有页面的级别值之和增加了1，A页略有增加，而B、C则用大幅下降。<br />
再看右边的例子，假定同上。</p>
<p>PR(A) = 0.25 + 0.75 (10 + PR(C))<br />
PR(B) = 0.25 + 0.75 × PR(A)<br />
PR(C) = 0.25 + 0.75 × PR(B)<br />
得：<br />
PR(A) = 517/37 = 13.97<br />
PR(B) = 397/37 = 10.73<br />
PR(C) = 307/37 = 8.30</p>
<p>增加页面D：<br />
PR(A) = 0.25 + 0.75 (10 + PR(D))<br />
PR(B) = 0.25 + 0.75 × PR(A)<br />
PR(C) = 0.25 + 0.75 × PR(B)<br />
PR(D) = 0.25 + 0.75 × PR(C)<br />
得：<br />
PR(A) = 419/35 = 11.97<br />
PR(B) = 323/35 = 9.23<br />
PR(C) = 251/35 = 7.17<br />
PR(D) = 197/35 = 5.63</p>
<p>增加页面后，所有页面级别增加了1，但每个页面的级别值减少了，这是由于新加页面分享了入链代来的值。从这个结果看，增加页面减少了已有页面的级别值，露了google算法青睐小站点的特点。当然，大站点也会因内容丰富而吸引其它站点的出链而得以级别值增加。</p>
<p>返回顶端</p>
<p>4、针对搜索引擎优化的级别分布<br />
先看两个列子，阻尼系数为0.5，PR(X)/C(X)=10;</p>
<p>BC之间无链接时：<br />
PR(A) = 0.5 + 0.5 (10 + PR(B) + PR (C))<br />
PR(B) = 0.5 + 0.5 (PR(A) / 2)<br />
PR(C) = 0.5 + 0.5 (PR(A) / 2)<br />
得<br />
PR(A) = 8<br />
PR(B) = 2.5<br />
PR(C) = 2.5<br />
BC之间互相链接时：<br />
PR(A) = 0.5 + 0.5 (10 + PR(B) / 2 + PR(C) / 2)<br />
PR(B) = 0.5 + 0.5 (PR(A) / 2 + PR(C) / 2)<br />
PR(C) = 0.5 + 0.5 (PR(A) / 2 + PR(B) / 2)<br />
得：<br />
PR(A) = 7<br />
PR(B) = 3<br />
PR(C) = 3</p>
<p>当BC 间互链时，虽然减少了A的级别，但BC都增加了。这符合优化站点所有页面而非只主页的优化思路，因为只有每个页面的级别都提高了，当有检索词命中这些页面 时，它们才能排在前面。这种优化的方法也很明显了，就是尽可能地在所有页面间平均分布入链的贡献，各低级页面要增加互链。</p>
<p>返回顶端</p>
<p>5、出链连接技巧<br />
只要不影响易用性，尽可能地将所有出链集中在一个或几个低级页面中，可以有效地降低出链对页面级别计算的负面影响。看列子：阻尼系数为0.5，PR(X)/C(X)=10;</p>
<p>BCD都有出链时：<br />
PR(A) = 0.5 + 0.5 (PR(B) / 2 + PR(C) / 2 + PR(D) / 2)<br />
PR(B) = PR(C) = PR(D) = 0.5 + 0.5 (PR(A) / 3)<br />
得：<br />
PR(A) = 1<br />
PR(B) = 2/3<br />
PR(C) = 2/3<br />
PR(D) = 2/3<br />
出链集中于D时：<br />
PR(A) = 0.5 + 0.5 (PR(B) + PR(C) + PR(D) / 4)<br />
PR(B) = PR(C) = PR(D) = 0.5 + 0.5 (PR(A) / 3)<br />
得：<br />
PR(A) = 17/13<br />
PR(B) = 28/39<br />
PR(C) = 28/39<br />
PR(D) = 28/39</p>
<p>从结果看，出链集中后，ABCD各页面的级别都上升了。</p>
<p>返回顶端</p>
<p>6、交换连接的特性<br />
链接交换增加了实施交换的页面的级别，却减少了其它页面的级别。如图，阻尼系数为0.5，PR(X)/C(X)=10;</p>
<p>交换前，<br />
PR(A) = 4/3<br />
PR(B) = 5/6<br />
PR(C) = 5/6</p>
<p>PR(D) = 4/3<br />
PR(E) = 5/6<br />
PR(F) = 5/6<br />
交换后；<br />
PR(A) = 0.5 + 0.5 (PR(B) + PR(C) + PR(D) / 3)<br />
PR(B) = PR(C) = 0.5 + 0.5 (PR(A) / 3)<br />
PR(D) = 0.5 + 0.5 (PR(E) + PR(F) + PR(A) / 3)<br />
PR(E) = PR(F) = 0.5 + 0.5 (PR(D) / 3)<br />
得<br />
PR(A) = 3/2<br />
PR(B) = 3/4<br />
PR(C) = 3/4<br />
PR(D) = 3/2<br />
PR(E) = 3/4<br />
PR(F) = 3/4</p>
<p>这情况恰好与增加站内互链的效果相反。由此，当需要对主页进行针对某一关键词的优化时，才取交换链接是可取的。<br />
例中级别值的重新分布，更基本的前提是两个站点中参考交换的页面互相为对方提供的级别值是相等的。如果一个站的某个页面级别高或少出链，则这个站所有页 面的级别会降低。这儿一个重要的影响因素是站点页面的数量。当一个站点的页面更多时，有更多的入链级别值被分布到站点的其它页面中，因而参考交换的页面不 能提供更多贡献给对方。</p>
<p><strong>Google的PageRank算法学习三<br />
</strong>1、其他有关PageRank的观点<br />
很 多针对搜索引擎做网站优化的专家，认为google给一些特殊站点以特定的级别而不是按前述算法进行计算，这些网站的级别很有可能来在Yahoo或ODP (Open Directory Project)。Lawrence Page在他们的专利说明中，提到随机冲浪模型中，用记不愿继续点击时，很有可能借助Yahoo的目录或ODP到另一个站点去。<br />
由于前述的算法，无论初始的级别值如何，经过足够次数的迭代最终结果都是一样的，所以对这些特殊站点可能采用下述的公式。</p>
<p>PR(A) = E(A) (1-d) + d (PR(T1)/C(T1) + &#8230; + PR(Tn)/C(Tn))</p>
<p>从另一个角度来看，如果给页面赋一个跟其实际级别相近的初始值，可以明显减少迭代次数。</p>
<p>返回顶端</p>
<p>2、影响页面级别的其它因素<br />
在Lawrence Page和Sergey Brin关于PageRank的论文发表以后，除了web的链接结构以外，还有没有别的因素被加到PageRank的算法当中曾经有过广泛地讨论。 Lawrence Page本人在PageRank的专利说明中曾指出以下潜在的影响因素：链接的能见度，链接在文档中的位置，web页面间的距离，出链页面的重要性，页面 的不过时。这此因素的增加，可以更好用随机冲浪模型模拟人类利用web的行为。<br />
不管上述附加因素有没有在实际计算PageRank时使用，如何实现这些附加因素仍要讨论。<br />
首先算法公式需要改进.</p>
<p>PR(A) = (1-d) + d (PR(T1)×L(T1,A) + &#8230; + PR(Tn)×L(Tn,A))</p>
<p>此处，L(T1,A)是入链的评价值，由几个因素构成，只需要在迭代前计算一次，减少了对数据库的查询次数，虽然每次迭代的查询结果会有不同。</p>
<p>Lawrence Page在PageRank的专利说明中指出链接评价的两个因素是链接的可见性和在文档中的位置。链接评价取代了PR(A)/C(A)，指出了对一特定的页面的链接，每个链接被点击的概率是不同的。<br />
此处，每一链接有两个属性值，X表示可见度，如果没有被重点强调（如粗体、斜体等）为1否则为2，Y表链接在文档中的位置，如果在文档下半部为1否则为3。则有</p>
<p>X(A,B) × Y(A,B) = 1 × 3 = 3<br />
X(A,C) × Y(A,C) = 1 × 1 = 1<br />
X(B,A) × Y(B,A) = 2 × 3 = 6<br />
X(B,C) × Y(B,C) = 2 × 1 = 2<br />
X(C,A) × Y(C,A) = 2 × 3 = 6<br />
X(C,B) × Y(C,B) = 2 × 1 = 2<br />
易得：<br />
Z(A) = X(A,B) × Y(A,B) + X(A,C) × Y(A,C) = 4<br />
Z(B) = X(B,A) × Y(B,A) + X(B,C) × Y(B,C) = 8<br />
Z(C) = X(C,A) × Y(C,A) + X(C,B) × Y(C,B) = 8<br />
链接评价公式为：（页面T1指向T2）<br />
L(T1,T2) = X(T1,T2) × Y(T1,T2) / Z(T1)<br />
有：<br />
L(A,B) = 0.75<br />
L(A,C) = 0.25<br />
L(B,A) = 0.75<br />
L(B,C) = 0.25<br />
L(C,A) = 0.75<br />
L(C,B) = 0.25<br />
最后利用改进的公式计算页面级别：<br />
PR(A) = 0.5 + 0.5 (0.75 PR(B) + 0.75 PR(C))<br />
PR(B) = 0.5 + 0.5 (0.75 PR(A) + 0.25 PR(C))<br />
PR(C) = 0.5 + 0.5 (0.25 PR(A) + 0.25 PR(B))<br />
得：<br />
PR(A) = 819/693<br />
PR(B) = 721/693<br />
PR(C) = 539/693</p>
<p>为了防止人为的级别优化，页面的距离被用来影响链接的评价。站内链接的权重小于站间链接的权重。页面的距离可能由页面是否在一个站内、一个服务器及物理距离等决定。<br />
另一个影响页面重要性的能参数，是页面的不过时性（up-to-dateness），意指有越多的新建的页面指向某一个页面，则这个页面内容过时的可能性越小。<br />
为增加这些因素的影响，要对公式进行修订如下：</p>
<p>L(Ti,A) = K(Ti,A) × K1(Ti) × &#8230; × Km(Ti)</p>
<p>其中，K(Ti,A)表示链接可见度及位置的权重，Kn(Ti)是第n个因素对页面Ti的影响。看列子：此处，从C引出的链接的重要性是其它的4倍。</p>
<p>K(A) = 0.5<br />
K(B) = 0.5<br />
K(C) = 2<br />
计算级别值：<br />
PR(A) = 0.5 + 0.5 × 2 PR(C)<br />
PR(B) = 0.5 + 0.5 × 0.5 × 0.5 PR(A)<br />
PR(C) = 0.5 + 0.5 (0.5 PR(B) + 0.5 × 0.5 PR(A))<br />
得：<br />
PR(A) = 4/3<br />
PR(B) = 2/3<br />
PR(C) = 5/6</p>
<p>此时，所有页面的级别之和不等于页面数量。</p>
<p>返回顶端</p>
<p>3、基于主题或标题的搜索评级<br />
因google没有采用，略去不看。</p>
<p>返回顶端</p>
<p>4、Google的PR0惩罚<br />
Google对采用了搜索优化的网站的一种惩罚就是，把这个站的所有或很多网页的网页级别定为0，典型的表现就是原先不为0忽然变为0的情况。当然，PR为0不一定是受到了惩罚，可能只是因为没有重要页面链到它。<br />
一个Google的员工在WebmasterWorld&#8217;s Google News论坛上一再提醒网站管理员，一定不要&#8221;链接到坏邻居&#8221;。Raph Levien提出了一种技术分析链接结构获取页面的负面特征，与&#8221;PageRank&#8221;相似但目标相反，名之为&#8221;BadRank&#8221;。<br />
BadRank基于&#8221;链到坏邻居&#8221;，对BadRank有影响显然是出链，因为对PageRank的算法加以改动，即会适合BadRank的计算。</p>
<p>BR(A) = E(A) (1-d) + d (BR(T1)/C(T1) + &#8230; + BR(Tn)/C(Tn))</p>
<p>, 其中，BR(A) 是页面A的BadRank, BR(Ti)页面Ti的BadRank,页面A有链接到Ti,C(Ti)页面Ti的入链数，d是阻尼系数，E(A)表示当前页面有没有被垃圾网页过滤系统 检测到。当E(A)为0时，这个公式不再有意义，它只是变成了另一种分析链接结构的方法而已。所有页面的E(A)之和等页面总数。看例子,令E(A)= 100,其它的为1，d=0.85,则有</p>
<p>Page<br />
BadRank</p>
<p>A<br />
22.39</p>
<p>B/C<br />
17.39</p>
<p>D/E/F/G<br />
12.21</p>
<p>可见页面A的BadRank被分布到每个页面中了。<br />
上例中，如果所有页面的BadRank都为1，阻尼系数为0.85,页面G链到一个页面X，E(X)=10，且这个链接是X的唯一的入链。则有</p>
<p>Page<br />
BadRank</p>
<p>A<br />
4.82</p>
<p>B<br />
7.50</p>
<p>C<br />
14.50</p>
<p>D<br />
4.22</p>
<p>E<br />
4.22</p>
<p>F<br />
11.22</p>
<p>G<br />
17.18</p>
<p>在这种情况下，所有页面的BadRank都有增加，A增加得比较少。<br />
常见这样的网站，主页的pagerank在2－4之间，而其它页面为0，这是可能由于受到了Google的惩罚，或者可能只是低层页面有链接到&#8221;坏邻居&#8221;。（真是这样吗？我的网站就如所述。可怕）。<br />
如果将BadRank和PageRank结合，有多方法，一是相减，一是相除，一是BadRank到了一定值就PageRank=0,等等。其实，两者 如何结合并不重要。但是其后果却值得重视。一种情况是，一个页面的PageRank很高，它的BadRank也不低但相对于其PageRank却可以忽 略，那么如果一个链向这个页面但PageRank不高的页面将会深受其害了。另一种情况更严重，无论有多少入链帮助增加PageRank，一个到&#8221;坏邻居 &#8220;的出链就可能导致PR0。对于后一种情况，Google的Matt Cutt发言说，一个到&#8221;坏邻居&#8221;的链接并不会造成伤害，但如果有20，就是个问题了。对于一高一低两个PageRank的页面，都连到一个&#8221;坏邻居&#8221;, 低PageRank的页面受到的伤害会更厉害，只喜欢Google能区别这种情况，否则出链就只有坏处而不见什么好处了。<br />
上述关于PRO的内容，都是关于BadRank的思考，但是对链接结构进行同PageRank相似的分析来确定BadRank似乎是Google的唯一的思路。</p>
<hr/><p style="font-size:1.5em;font-weight:bold;"><a href="http://www.thinkagain.cn/archives/31.html#comments">评论1:</a></p><p><strong>1.</strong><i>2012.01.05.3:19.pm</i>.&nbsp;<a href="http://www.saaseo.cn/591.html">PR=(1-d)/N+d(PR(T1)/C(T1)+ &#8230; +PR(Tn)/C(Tn)) - 西安SEO - 聚云SEO博客</a>: [...] http://www.thinkagain.cn/archives/31.html [...]</p><hr/><p style="font-size:1.5em;font-weight:bold;">推荐阅读</p><p><i>2009.01.10.10:54.pm</i>.&nbsp;<a href="http://www.thinkagain.cn/archives/1032.html" title="话说某日，在网络山头浏览器山寨里面，外面天寒地冻，老I（IE）仍旧窝在">让小C(Chrome)用得更顺手 &#8211; - 添加到Google Bookmark按钮 (37)</a></p><p><i>2008.09.02.1:41.pm</i>.&nbsp;<a href="http://www.thinkagain.cn/archives/992.html" title="JDAM，啥玩意？知道的同学们在此先表扬下。(军事迷们估计一看就知道了)
">JDAMs (23)</a></p><p><i>2008.08.01.4:01.pm</i>.&nbsp;<a href="http://www.thinkagain.cn/archives/976.html" title="Updated:2008-08-08,Problem Solved,
谢谢网友circle的留言，Google已经放出了个https下g">Gmail Notifier也抽风？ (21)</a></p><p><i>2008.07.17.8:31.pm</i>.&nbsp;<a href="http://www.thinkagain.cn/archives/960.html" title="用上DH2天了。感觉还不错。有个独立Cpanel，很方便查看自己的网站情况。更">扯蛋还是混蛋之Google Apps注册 (12)</a></p><p><i>2008.05.05.6:42.pm</i>.&nbsp;<a href="http://www.thinkagain.cn/archives/914.html" title="5月5日，是日本法定节日之一，儿童节。前后正好连着好几个法定节日，宪">こどもの日-2008 (4)</a></p><p><i>2008.02.15.11:42.pm</i>.&nbsp;<a href="http://www.thinkagain.cn/archives/896.html" title="&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;昨日，背着、拎着、拖着行李和老婆，回到了日">Google T-Shirt BY UNIQLO (8)</a></p><p><i>2007.11.14.11:30.pm</i>.&nbsp;<a href="http://www.thinkagain.cn/archives/872.html" title="刚刚发完第5回ひびきの祭-(2)一文，习惯性地在后台看下useronline情况。竟然">Welcome BOTs (4)</a></p><p><i>2007.10.23.1:25.pm</i>.&nbsp;<a href="http://www.thinkagain.cn/archives/823.html" title="午间小憩，查看网站统计的时候，发现有些国外来的浏览者，是通过translate">本站新增中文到英文翻译功能 (2)</a></p><hr/><p>Copyright &copy; 2012&nbsp;|&nbsp;<a href="http://www.thinkagain.cn">Think Again</a>&nbsp;|&nbsp;<a href="http://www.thinkagain.cn/archives/31.html">原文链接</a></p><img src="http://img.tongji.cn.yahoo.com/710673/ystat.gif"/>]]></content:encoded>
			<wfw:commentRss>http://www.thinkagain.cn/archives/31.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

