伍佰目录 短网址
  当前位置:海洋目录网 » 站长资讯 » 教育考试 » 文章详细 订阅RssFeed

数据结构与算法专题——第三题 最长公共子序列

来源:本站原创 浏览:85次 时间:2022-12-12
一:作用

最长公共子序列的问题常用于解决字符串的相似度,是一个非常实用的算法,作为码农,此算法是我们的必备基本功。

二:概念

举个例子,cnblogs这个字符串中子序列有多少个呢?很显然有27个,比如其中的cb,cgs等等都是其子序列,我们可以看出子序列不见得一定是连续的,连续的那是子串。我想大家已经了解了子序列的概念,那现在可以延伸到两个字符串了,你可以看出 cnblogs 和 belong 的公共子序列吗?在你找出的公共子序列中,你能找出最长的公共子序列吗?

从图中可以看到最长公共子序列为blog,仔细想想我们可以发现其实最长公共子序列的个数不是唯一的,可能会有两个以上,但是长度一定是唯一的,比如这里的最长公共子序列的长度为4。

三:解决方案1. 枚举法

这种方法是最简单,也是最容易想到的,当然时间复杂度也是龟速的,可以分析一下,刚才也说过了cnblogs的子序列个数有27个 ,延伸一下:一个长度为N的字符串,其子序列有2N个,每个子序列要在第二个长度为N的字符串中去匹配,匹配一次需要O(N)的时间,总共也就是O(N*2N),可以看出,时间复杂度为指数级,恐怖的令人窒息。

2. 动态规划

既然是经典的题目肯定是有优化空间的,并且解题方式是有固定流程的,这里我们采用的是矩阵实现,也就是二维数组。

  • 第一步:先计算最长公共子序列的长度。

  • 第二步:根据长度,然后通过回溯求出最长公共子序列。

现有两个序列X={x1,x2,x3,...xi},Y={y1,y2,y3,....,yi},设一个C[i,j]: 保存Xi与Yj的LCS的长度。

递推方程为:

不知道大家看懂了没?动态规划的一个重要性质特点就是解决“子问题重叠”的场景,可以有效的避免重复计算,根据上面的公式其实可以发现C[i,j]一直保存着当前(Xi,Yi)的最大子序列长度,代码如下:


   public class Program
   {
       static int[,] martix;

       static string str1 = "cnblogs";
       static string str2 = "belong";

       static void Main(string[] args)
       {
           martix = new int[str1.Length + 1, str2.Length + 1];

           LCS(str1, str2);

           //只要拿出矩阵最后一个位置的数字即可
           Console.WriteLine("当前最大公共子序列的长度为:{0}", martix[str1.Length, str2.Length]);

           Console.Read();
       }

       static void LCS(string str1, string str2)
       {
           //初始化边界,过滤掉0的情况
           for (int i = 0; i <= str1.Length; i++)
               martix[i, 0] = 0;

           for (int j = 0; j <= str2.Length; j++)
               martix[0, j] = 0;

           //填充矩阵
           for (int i = 1; i <= str1.Length; i++)
           {
               for (int j = 1; j <= str2.Length; j++)
               {
                   //相等的情况
                   if (str1[i - 1] == str2[j - 1])
                   {
                       martix[i, j] = martix[i - 1, j - 1] + 1;
                   }
                   else
                   {
                       //比较“左边”和“上边“,根据其max来填充
                       if (martix[i - 1, j] >= martix[i, j - 1])
                           martix[i, j] = martix[i - 1, j];
                       else
                           martix[i, j] = martix[i, j - 1];
                   }
               }
           }
       }
   }

图大家可以自己画一画,代码完全是根据上面的公式照搬过来的,长度的问题我们已经解决了,这次要解决输出最长子序列的问题,采用一个标记函数 Flag[i,j],当

①:C[i,j]=C[i-1,j-1]+1 时标记Flag[i,j]="left_up"; (左上方箭头)

②:C[i-1,j]>=C[i,j-1] 时标记Flag[i,j]="left"; (左箭头)

③: C[i-1,j]<C[i,j-1] 时 标记Flag[i,j]="up"; (上箭头)

例如:我输入两个序列X=acgbfhk,Y=cegefkh。


   public class Program
   {
       static int[,] martix;

       static string[,] flag;

       static string str1 = "acgbfhk";

       static string str2 = "cegefkh";

       static void Main(string[] args)
       {
           martix = new int[str1.Length + 1, str2.Length + 1];

           flag = new string[str1.Length + 1, str2.Length + 1];

           LCS(str1, str2);

           //打印子序列
           SubSequence(str1.Length, str2.Length);

           Console.Read();
       }

       static void LCS(string str1, string str2)
       {
           //初始化边界,过滤掉0的情况
           for (int i = 0; i <= str1.Length; i++)
               martix[i, 0] = 0;

           for (int j = 0; j <= str2.Length; j++)
               martix[0, j] = 0;

           //填充矩阵
           for (int i = 1; i <= str1.Length; i++)
           {
               for (int j = 1; j <= str2.Length; j++)
               {
                   //相等的情况
                   if (str1[i - 1] == str2[j - 1])
                   {
                       martix[i, j] = martix[i - 1, j - 1] + 1;
                       flag[i, j] = "left_up";
                   }
                   else
                   {
                       //比较“左边”和“上边“,根据其max来填充
                       if (martix[i - 1, j] >= martix[i, j - 1])
                       {
                           martix[i, j] = martix[i - 1, j];
                           flag[i, j] = "left";
                       }
                       else
                       {
                           martix[i, j] = martix[i, j - 1];
                           flag[i, j] = "up";
                       }
                   }
               }
           }
       }

       static void SubSequence(int i, int j)
       {
           if (i == 0 || j == 0)
               return;

           if (flag[i, j] == "left_up")
           {
               Console.WriteLine("{0}: 当前坐标:({1},{2})", str2[j - 1], i - 1, j - 1);

               //左前方
               SubSequence(i - 1, j - 1);
           }
           else
           {
               if (flag[i, j] == "up")
               {
                   SubSequence(i, j - 1);
               }
               else
               {
                   SubSequence(i - 1, j);
               }
           }
       }
   }

由于直接绘图很麻烦,嘿嘿,我就用手机拍了张:

好,我们再输入两个字符串:


   static string str1 = "abcbdab";
   static string str2 = "bdcaba";

通过上面的两张图,我们来分析下它的时间复杂度和空间复杂度。

  • 时间复杂度:构建矩阵我们花费了O(MN)的时间,回溯时我们花费了O(M+N)的时间,两者相加最终我们花费了O(MN)的时间。

  • 空间复杂度:构建矩阵我们花费了O(MN)的空间,标记函数也花费了O(MN)的空间,两者相加最终我们花费了O(MN)的空间。


  推荐站点

  • At-lib分类目录At-lib分类目录

    At-lib网站分类目录汇集全国所有高质量网站,是中国权威的中文网站分类目录,给站长提供免费网址目录提交收录和推荐最新最全的优秀网站大全是名站导航之家

    www.at-lib.cn
  • 中国链接目录中国链接目录

    中国链接目录简称链接目录,是收录优秀网站和淘宝网店的网站分类目录,为您提供优质的网址导航服务,也是网店进行收录推广,站长免费推广网站、加快百度收录、增加友情链接和网站外链的平台。

    www.cnlink.org
  • 35目录网35目录网

    35目录免费收录各类优秀网站,全力打造互动式网站目录,提供网站分类目录检索,关键字搜索功能。欢迎您向35目录推荐、提交优秀网站。

    www.35mulu.com
  • 就要爱网站目录就要爱网站目录

    就要爱网站目录,按主题和类别列出网站。所有提交的网站都经过人工审查,确保质量和无垃圾邮件的结果。

    www.912219.com
  • 伍佰目录伍佰目录

    伍佰网站目录免费收录各类优秀网站,全力打造互动式网站目录,提供网站分类目录检索,关键字搜索功能。欢迎您向伍佰目录推荐、提交优秀网站。

    www.wbwb.net