Knuth–Morris–Pratt algorithm border

プログラミング

一覧

 状態:  閲覧数:1,371  投稿日:2018-03-15  更新日:2018-04-29

内容



border とは?

 閲覧数:432 投稿日:2018-03-16 更新日:2018-05-08

border とは?


ある文字列の prefix と suffix が一致している場合の、一致している prefix と suffix
・ある文字列の prefix と suffix が一致している場合、一致している prefix と suffix をその文字列の border と呼ぶ
・但し、prefix と suffix は重複する部分があってもよいが一致していてはいけない
・border が空文字でも OK
・空文字には border が存在しない
・最も幅広い border を tagged border と呼ぶ

tagged borderの具体例


ababaa
・a


Knuth-Morris-Pratt algorithm

文字列の頭良い感じの線形アルゴリズムたち - あなたは嘘つきですかと聞かれたら「YES」と答えるブログ
string - Knuth–Morris–Pratt algorithm: border array - Stack Overflow
Knuth–Morris–Pratt(KMP) Pattern Matching(Substring search) - YouTube
algorithm - Finding the longest border of a string - Stack Overflow
Knuth-Morris-Pratt algorithm - コードの恵み
Knuth-Morris-Pratt algorithm

MP法とKMP法の違い
Knuth-Morris-Pratt algorithm
http://winnie.kuis.kyoto-u.ac.jp/members/okuno/Lecture/02/DataStructure/ds-02-13.pdf

感想

 閲覧数:468 投稿日:2018-05-08 更新日:2018-05-08

2018/3/10


10ヶ月経過
・ようやく最低限の動作確認が出来た
・KMPの根本的な理解は全然出来ていないが、少なくともこうすればKMP法で求められるという最低限のコピペは出来るようになった(内容は理解できていないけれども)

最低限の理解が出来るようになるまで時間がかかった理由
・インターネットに掲載されている内容が、サイト毎に異なる
・KMP法として説明されている内容のほとんどがMP法を解説したもの
・インターネットだけではなく、書籍の中でもKMP法と称してMP法を紹介しているものもある
・インターネットに掲載されている大学の講義資料でも同様
レーベンシュタインを学習した際も苦労したが、解説内容がサイト毎に異なると初学者は非常に困る
・ネットに掲載されている情報が微妙に異なる例としては色変換もそう。こちらも未だに違いを理解できていない

今回気が付いたこと
・KMP法はMP法の先にある考え方
・MP法を理解してから、KMP法を学習したほうが良い

MP法の考え方
・割合簡単

KMP法の考え方
・超絶難しい
・KMP法は、MP法の計算結果を元に、さらなる計算を行っている
・計算方法はコピペ出来たが、その意味は未だ理解できていない

2018/3/15


最低限の動作確認を出来たと思ったが、甘かったかも
・「篠原研究室」と「Université de Rouen」で異なる結果を返す場合があることに気が付く
・何れが正しいの? あるいは両方とも正なの?

2018/3/20


今日確認したら両方とも合っていた
・「篠原研究室」のコードが変更されたのかな? と思い確認したが以前と同じだった
・何か勘違いしている?
・単に疲れていたから見間違えただけ?
・まあでも、合っているなら、それに越したことはない

2018/3/23 → 2018/5/7


詳しそうだけれども具体的な事例が未掲載なため、正しいか否か判断不能
JAIST 北陸先端科学技術大学院大学

内容が期待した結果とあまりに乖離している
・理解できないため、とりあえず見なかったことにする
和歌山大学
山梨大学








KMP法が分からないので調べているのですが

KMP法の移動量テーブルについて





技術書籍

コード管理



週間人気ページランキング / 1-30 → 2-5
順位 ページタイトル抜粋 アクセス数
1 ANRIとは? / ジェネラルパートナー株式会社 4
2 GitHubリモートリポジトリ名には日本語を使用できない。使用すると、ハイフンへ自動置換されてしまう | GitHub(Git) 3
3 Twitter API v1.1 | Twitter Developer(Twitter) 2
3 開発 0 2
3 意図せずSubModule(ディレクトリに白い矢印)が作成された場合は、「$ git rm -rf --cached <対象ファイル or path>」後、「$ git add <対象ファイル or path>」 | Git BASH(Git) 2
4 Phone number is already in use for too many accounts and cannot be added to another user. | Twitter Developer(Twitter) 1
4 コインチェック株式会社   | Webサービスビジネス 1
4 mhtmlの問題 / mhtmlで保存するのは何のため? / 欲しい拡張機能がないため、自分で作成するしかない 1
4 Windows10で使用できるGitクライアント | GitHub(Git) 1
4 同じ携帯電話番号でも、複数の「Twitter Developers」アカウントを作成可能 | Twitter Developer(Twitter) 1
4 Git BASH 作業履歴 2022/10/20 / P48 site-rank(First-Ranking-Service) 2 / P25をP48のリポジトリへ反映させていたので、「git push -f origin main」で強制上書き実行 | Git BASH(Git) 1
4 Twitter引用転載仕様調査 | Twitter Developer(Twitter) 1
4 Twitter 目次 | Twitter Developer(Twitter) 1
4 Git Bash で異なるディレクトリの指定ディレクトリへ移動する。「$ cd /L/3_開発/git/大阪府」 | Git BASH(Git) 1
2025/2/6 1:02 更新