陪君醉笑三万场,不诉离伤

两个字符串无序匹配问题

上一篇 / 下一篇  2008-03-13 12:05:23

查看( 437 ) / 评论( 4 )
表t1中有两个字段NO(NUMBER类型),ST(VARCHAR2类型)
表中有如下值
NO           ST
1        'A1A3BCLKMBNK'
2        'A2A4MBKLDMSK'
3        ..........................
.         ..........................
.         ..........................
.         ..........................

注:ST字段中的值长度都是2的整数倍;


有一变量V_E,变量值为'A3MLLKNKDS'

现在将t1表中的ST字符与变量V_E进行比较,比较的方法如下:
V_E变量中每两个字符为一个基本单位,ST字段也是以两个字符为一个基本单位,让V_E与ST字段进行比较,得出ST中与V_E基本单位相同的数量

即:
t1表中的值可以看做
NO           ST

1        'A1  A3  BC  LK  MB  NK'
2        'A2  A4  MB  KL  DM  SK'
---------------------------------------------
变量V_E可以看做
V_E  -->  'A3 ML LK NK DS'
---------------------------------------------


比较之后得出:

NO           ST                         相同值     相同数量
1        'A1A3BCLKMBNK'      A3 LK NK        3
2        'A2A4MBKLDMSK'                            0


-----------------------------------------------------------------------------------------------------------------------------
CREATE OR REPLACE FUNCTION FUN_MATCH_CNT(P_STR VARCHAR2, P_STR2 VARCHAR2) RETURN NUMBER IS
    V_MOTHER VARCHAR2(200);
    V_MATCH  VARCHAR2(20);
    V_LENGTH NUMBER;
    V_LENM   NUMBER :=2;
    V_NUM    NUMBER := 0;
    V_CNT    NUMBER ;
  BEGIN     
          V_CNT  := 0;
    V_MOTHER := P_STR;
                --V_MATCH := P_STR2;
    --将 V_MOTHER值改变成每两个字符被逗号隔开的值
                V_LENGTH := LENGTH(REPLACE(P_STR,',','')) / 2;
    V_LENM   := LENGTH(P_STR2) / 2;
                IF(INSTR(V_MOTHER,',')= 0 ) THEN      
                        FOR X IN 1 .. (V_LENGTH - 1) LOOP
          V_MOTHER := SUBSTR(V_MOTHER, 1, (V_LENGTH - X) * 2) || ',' ||
                  SUBSTR(V_MOTHER, (V_LENGTH - X) * 2 + 1);
      END LOOP;
                END IF;
    --DBMS_OUTPUT.PUT_LINE(V_MOTHER);
    --针对每个基本单位进行比较
    FOR Y IN 1 .. V_LENM LOOP      
                   V_MATCH := SUBSTR(P_STR2, Y * 2 - 1, 2);
       SELECT SIGN(INSTR(V_MOTHER,V_MATCH ))
        INTO V_NUM
        FROM DUAL;
                                IF V_NUM = 1 THEN
                                      SELECT SUBSTR(V_MOTHER,1,INSTR(V_MOTHER, V_MATCH)-1)||SUBSTR(V_MOTHER,INSTR(V_MOTHER, V_MATCH)+3)
                                                        INTO V_MOTHER
                                                        FROM DUAL;
              V_CNT := V_CNT + V_NUM;
                                                        V_CNT := V_CNT + FUN_MATCH_CNT(V_MOTHER,V_MATCH);
                          END IF;
    END LOOP;
    ---DBMS_OUTPUT.PUT_LINE(V_CNT);
    RETURN V_CNT;
  END;

-------------------------------------------------------------------------------------------------------------------------------------
SELECT NO,ST,FUN_MATCH_CNT(ST,'A3MLLKNKDS') FROM T1;

NO           ST                             相同数量
1        'A1A3BCLKMBNK'              3
2        'A2A4MBKLDMSK'              0

-------------------------------------------------------------------------------------------------------------------------------------

使用递归或者循环匹配方式效率太低,希望各路高人能有更好的方法

[ 本帖最后由 wghxwl12 于 2008-3-18 12:31 编辑 ]

TAG:

晶晶小妹的个人空间 晶晶小妹 发布于2008-03-17 22:08:36
要求斑竹删除2楼...还以为有什么好的算法呢...
晶晶小妹的个人空间 晶晶小妹 发布于2008-03-17 22:19:17
也学下oracle 搞个hash如何?

两个字符按asII码算出来一个hash值,可能会有重复,但是由于只有两个字符,重复不会太多.
根据'A3 ML LK NK DS'生成N个hash桶,拿T1表的'A1  A3  BC  LK  MB  NK'....去和hash桶比较...
晶晶小妹的个人空间 晶晶小妹 发布于2008-03-17 22:33:53
感觉2维数组也行,ascII码还会有重复呢,用2维数组就不会有重复了.ascII码最多256个,楼主的要求每个用于比较的字符串长度为2.
建立一个256*256的2维数组即可.然后根据V_E先为2维数组中指定的位置,附上固定的长量.
比如 ar[65][51]=1;
         ar[77][76]=1;
         ar[76][75]=1;
         ar[78][75]=1;
         ar[68][83]=1;

现在开始搜索第1行'A1  A3  BC  LK  MB  NK'
利用A1为[65][49] 直接比较ar[65][49]是否等于1.如果是证明找到一个匹配的.否则继续查找A3 ar[65][51]处.


这样就不再需要双重循环了.
晶晶小妹的个人空间 晶晶小妹 发布于2008-03-18 01:40:03
我实验了下,这里有详细的步骤.
http://www.itpub.net/thread-955650-1-1.html
我来说两句

(可选)

日历

« 2008-11-21  
      1
2345678
9101112131415
16171819202122
23242526272829
30      

数据统计

  • 访问量: 1437
  • 日志数: 1399
  • 建立时间: 2007-12-14
  • 更新时间: 2008-11-20

RSS订阅

Open Toolbar