関数型 Leetcode 百題 – 順列

24/04/2024

序章
31. 次の順列

WARNING

この記事は AI による中国語からの翻訳です。誤りが含まれている可能性がありますので、ご了承ください。

❖序章

アルゴリズムの問題は、多くのプログラマにとっての悪夢の一つです。アルゴリズム自体は確かに興味深いものですが、問題を解けない焦燥感や面接で答えられない恥ずかしさは誰もが好まないものです。

アルゴリズムの問題への対処法としては、問題を解く という伝統的な方法があります。問題を解くとは、大量の問題を解いてアルゴリズムを学ぶことです。多くの人々は、数学の学習もアルゴリズムの学習も、大量の練習が必要だと信じています。

私もその理論に賛成です。ノイマンの格言は、このブログのトップページに掲げられています：

若者よ、数学では物事を理解するのではなく、慣れるだけだ。

直感的な理解、直感的な経験は、無比の価値を持つ財産です。練習はその貴重な財産を得る最も確実な手段です。要するに、アルゴリズムを学ぶためには、問題を解き、練習しなければなりません。

しかし、私はある種のアルゴリズム学習の常道を極度に嫌っています。それは、ある問題を解けない、10分間考えてからも手がかりが見つからない、そこで答えを探すという道です。あなたは答えを理解したり、答えを覚えておいたり、次に同じ問題が出てきたときに当てはめたりするかもしれません。あなたが見た答えが十分に多いなら、あなたが当てはめることができる問題も十分に多いでしょう。

なぜ私はその学習法が好きではないのでしょうか？私はそれほど頭が良くないのかもしれません。私は他人が提供する答えを理解するのが難しいです。あまりにも多くの人々は、最終的な効率的なアルゴリズムだけを教えてくれ、直感の形成の過程やアルゴリズムの証明を無視します。彼らの答えから、彼らが問題に対する深い理解を感じさせられず、またアルゴリズム自体の美しさを感じさせられません。

私たちは、天才に向けた教育を通じてしかアルゴリズムを学ぶことができないのでしょうか？

いいえ。世界には、純粋な関数型言語を使い、等式推導の方法でプログラムを設計しようとする人々がいます。彼らもまた直感の価値を大切にしています。彼らは、明確で効率の悪いプログラムから出発し、最終的な効率的なアルゴリズムへと一歩ずつ進みます。その過程で、アルゴリズムの美しさ、アルゴリズムの洞察が鮮やかに浮かび上がります。故リチャード・バード（Richard Bird）や台湾の穆信成先生は、その手法の先駆者です。彼らの論文と本の中で、私は真の優しさを感じました。

私は、等式推導はしばしば非常に困難であるかもしれませんが、アルゴリズムの non-trivial な部分が何であるか、アルゴリズムの直感が何であるかを明確に説明することは、それほど困難ではないかもしれません、と考えています。

このシリーズの記事は、私の試みです。これらの記事では、私は純粋な関数型プログラミングを使って Leetcode をどのように解くかを説明します。なぜ Leetcode を選んだのか、より難易度の高い Codeforces を選ばなかったのかというと、難易度が高すぎることは必ずしも良いことではないと考えているからです。難易度の高い問題は、しばしば複数のアルゴリズムが必要となる可能性があり、私たちは各記事で特定のアルゴリズムに焦点を当てたいと思っています。（もう一つの理由は、私自身がアルゴリズムに関しては初心者であるため、難易度が高すぎると対処できません）

Leetcode を選んだ結果、私たちは Haskell ではなく Racket や Scala を使ってコードを提出しなければならないことがあります。これは時々問題を引き起こす可能性がありますが、私の経験では、私が提示するほとんどの Haskell コードは Scala に直接翻訳できます。各問題に対して、私は対応する Scala の解も提供します。もし問題が生じた場合、たとえば Scala に Data.Graph という不変データ構造のライブラリがない場合など、私たちは状況により非純粋な関数型プログラミングに戻ることもあります。しかし、そのような状況は全体的には少ないはずです。各問題の最後には、対応する命令型のバージョンも提供するかもしれません。その場合、私たちは関数型バージョンと命令型バージョンの違いについても議論するかもしれません。

これらの記事は関数型プログラミング入門ではありません。私はおそらくいくつかのライブラリ関数の使い方を示すかもしれませんが、全体的には、これらの記事はあなたがすでに純粋な関数型プログラミングの基本的な知識を持っていることを前提としています – 再帰、リスト、fold、map など。あなたが関数型プログラミングや Haskell 言語について何も知らない場合、これらの記事を読む前に、いくつかの Haskell の知識を学ぶことをお勧めします。以下は、私が特に推奨する学習リソースです：

cis194 コース
Thinking Functionally With Haskell、およびその中国語翻訳版 Haskell関数型プログラム設計
練習は重要です。Haskell 99 問を通じて練習することができます。これらの練習は Leetcode とは異なり、ほとんどが直接の再帰で完了できます

道は遠く、修業は長し、上下に求めて進む

❖31. 次の順列

❖問題の説明

以下は、Leetcode の元の説明です：

整数配列の順列とは、そのすべてのメンバーを一連または線形の順序で並べることです。
例えば、arr = [1,2,3] の場合、以下のようなものはすべて arr の順列と見なすことができます：[1,2,3]、[1,3,2]、[3,1,2]、[2,3,1] 。整数配列の次の順列とは、その整数の次の辞書順の大きい順列を指します。より形式的に言えば、配列のすべての順列が辞書順で小さい順に並べられたコンテナに存在すると仮定すると、その配列の次の順列とは、その順序付けられたコンテナの中でその配列の直後に存在する順列を指します。次の大きな順列が存在しない場合、その配列は辞書順で最小の順列（つまり、その要素が昇順に並んでいる）に再配置する必要があります。
例えば、arr = [1,2,3] の次の順列は [1,3,2] です。同様に、arr = [2,3,1] の次の順列は [3,1,2] です。そして arr = [3,2,1] の次の順列は [1,2,3] です、なぜなら [3,2,1] は辞書順でより大きな順列が存在しないからです。整数配列 nums を与えられた場合、nums の次の順列を見つけ出してください。
必ずインプレースで値を変更し、追加の定数スペースしか使用しないようにしてください。

私たちは純粋な関数型プログラミングを行っています。純粋な関数型プログラミングでは変更という概念は存在しないため、最後の文は無視します。

❖最初の考え

一般的に、多くのアルゴリズムの問題は、非常に簡潔（しかし効率が低い）純粋な関数型解を与えることができます。私たちはその解をプログラムの標準参照（Spec）と呼び、私たちの思考はそこから始まります。しかし、この問題はそのような状況ではないようです。この問題の数学的な表現を考えます：

\text{next}(a) = \begin{cases} \min(\mathbb{P}) & a = \max(\mathbb{P}) \\ \min(\{ m | m \in \mathbb{P}, m > a \}) & \text{それ以外} \end{cases}

これは私たちにあまりインスピレーションを与えません。実際、多くのプログラミング言語では、 $\mathbb{P}$ 、つまりあるリストのすべての順列を求めるのが、この問題よりも面倒な場合があります。¹

そのような状況下、単純な再帰 が問題を解決できるのでしょうか？

❖再帰

次の順列関数（next と記す）は、順列と辞書順に基づいて定義されていますが、それはより一般的な構造に拡張される可能性があります。

まず、10進数の整数の状況を検討します。明らかに、10進数の整数にも next 関数を定義できます。これは大名鼎鼎の後続関数で、すなわち $f(x) = x + 1$ です。

10進数の整数は、リスト（または、命令型言語の配列）として表現できます。リストの各要素は、数字の各桁を示します。たとえば、 $100$ は [1, 0, 0] として表現されます。

私たちは特に、リスト表現下の後続関数に注目します。なぜなら、そのような表現下では、>= はちょうど辞書順の比較であるからです。私たちはリスト表現下、10進数の整数の後続関数を next10 と記します。

1-- next10 [1, 1, 0] = [1, 1, 1]
2next10 ...

たとえば、next10 [1, 1, 0] = [1, 1, 1] です。

この例は私たちに非常に強い直感を与えます。それは next10 [1, 0] = [1, 1] のとき、next10 [1, 1, 0] = 1 : next10 [1, 0] となることです。これを一般化すると、x:xs で表現された整数に対して、

1next10 (x:xs) = x:(next10 xs)

上記の式はほとんどの場合に成り立ちます。ただし、next10 xs が求められなくなるとき、たとえば [1, 9, 9] の次の数（後続）は [2, 0, 0] で、そのときには繰り上がりが必要となります。より厳密に言えば、99 は最大の2桁の10進数整数であるため、上記の等式は成り立ちません。xs がまだ最大値でない限り、上記の等式は成り立つことが証明できます。

同様に、問題で求められている next 関数も同様の性質を持つことが証明できます：xs が長さ length xs の順列の最大値でないとき、

1next (x:xs) = x:next xs

この性質はあまりにも重要で、私たちは直接再帰関数を構築することができます：

1next (x:xs)
2    | isMax xs  = tick x xs
3    | otherwise = x:next xs

それでは、問題は次の2つになります

isMax をどのように定義するか
xs がすでに最大値である場合、tick 関数をどのように定義するか

❖`isMax` の定義

順列 xs に対して、「最大」は、どのように再配置しても、新しい xs' に対して xs >= xs' が成り立つことを意味します。

どのような順列がそのような性質を持つのでしょうか？直感的な考え方は、これは辞書順であるため、順列が可能な限り大きくなるためには、大きな数を前に置くべきだということです。言い換えれば、「降順」の順列は必ず最大であるはずです。

1isMax :: Ord a => [a] -> Bool
2isMax = down

Haskellでリストの昇順または降順を判断するには、「zip with tail」の方法を使用できます。具体的には、リストとそのtailをzipし、その後mapやallなどの関数を使用して判断します。

1dup :: [a] -> [(a, a)]
2dup xs = zip xs (tail xs)
3
4down :: Ord a => [a] -> Bool
5down = all (uncurry (>=)) . dup

❖`tick` の定義

もし xs が down を満たしている場合、言い換えれば、それが最大である場合、x:xs を次の列挙に変換するためには複雑な操作が必要となります。この複雑な操作を、私はtickと名付けました。

例えば、[2, 4, 3, 1]の次の列挙は[3, 1, 2, 4]です。このとき、xは2、xsは[4, 3, 1]で、xsがdownを満たしているため、単純な再帰ではなく、tickを使用して計算する必要があります。

[2, 4, 3, 1]を引き続き例にとってみましょう。直感的に、[2, 4, 3, 1]の次の列挙ys@(y:ys')を得るためには、次の2つのステップに分けられます：

yが何であるかを決定する
ys'が何であるかを決定する

まず、yはxより厳密に大きでなければなりません。なぜなら、私たちはすでに、xで始まるすべての列挙がx:xsより小さいことを示したからです。次に、yは可能な限り小さくなければなりません、そうでなければ、pというより小さい列挙が存在し、p > x:xsとなります。

上記の例ではyは3です。すぐに思いつくのは、3はxs = [4, 3, 1]の中で、最小の x = 2より大きい数です。私たちはこのような数をpivotと呼びます。定義コードを以下に示します：

1pivot x xs = minimum [ x' | x' <- xs, x' > x  ]

xsが順序付けられていることに注意してください。上記のコードは以下のように書き換えることができます。

1pivot x = last . takeWhile (> x)

指摘しておくべきは、pivot関数は部分関数であり、不安全なlastとminimum操作を使用しているため、呼び出す際には少なくとも1つのx' > xが存在することを保証しなければなりません。

y > xを見つけることができれば、y:ys'は必ずx:xsより大きくなることを保証できます。したがって、ys'の構築はy:ys'を可能な限り小さくするように行います。言い換えれば、ys'は最小の列挙でなければなりません。最大値についての上記の議論と同様に、最小の列挙は単調増加の列挙です。これを行うためにはソートが必要です。

ys'の要素はxsからyを取り除いた後、xを追加したものです。例えば、上記の例[2, 4, 3, 1]では、

1x:xs = [2, 4, 3, 1]
2
3y = last . takeWhile (> x) $ xs
4  = last [4, 3]
5  = 3
6
7ys'' = delete 3 xs
8     = [4, 1]
9
10ys' = sort (x:ys'')
11    = sort [2, 4, 1]
12    = [1, 2, 4]
13
14ys = y:ys'
15   = [3, 1, 2, 4]

最後に、pivot x xs = ⊥という状況について議論する必要があります。この状況は事前に判断する必要があります、そうでなければエラーが発生します。pivotが存在しないのはいつでしょうか？それはx:xsがdownを満たしているときです、例えば[4, 3, 2, 1]のとき、このとき、入力を反転するだけで済みます。

以上の議論に基づき、tick関数の定義を以下に示します：

1import Data.List (delete)
2
3tick :: Ord a -> a -> [a] -> [a]
4tick x xs
5    | null l    = reverse (x:xs)
6    | otherwise = y:(sort (x:ys'))
7    where l = takeWhile (> x) xs
8          y = last l
9          ys' = delete y xs

1> tick 4 [3, 2, 1]
2[1, 2, 3, 4]
3
4> tick 2 [4, 3, 1]
5[3, 1, 2, 4]

疑いの余地なく、現在のnext関数はこの問題を正しく解決しています。読者は上記のHaskellコードをScalaに翻訳し、Leetcodeで試してみてください。再帰から出発し、この問題の解は非常に直感的で、簡単に且つ楽に提供できます。

❖より効率的なコード

上記で定義したnext関数は優雅で直感的ですが、十分に効率的ではありません。主な問題は、

tickでは、sortを使用する必要はありません。xsは順序付けられているため、この点を利用して新しい順序付けられた列挙を $O(n)$ 内で組み合わせることができます
downはnextによって何度も呼び出され、各呼び出しは $O(n)$ のため、全体の複雑度が $O(n^2)$ になります。

問題1.は非常に簡単で、tickを再定義するだけで済みます。

問題2.は少し複雑です。計算の過程を詳しく観察する必要があります、例えばnext [3, 5, 1, 4, 2]：

1next [3, 5, 1, 4, 2]
2= 3:(next [5, 1, 4, 2])
3= 3:(5:(next [1, 4, 2]))
4= 3:(5:(tick 1 [4, 2]))

計算は常に一種の「形状」を持ち、それは入力の前半部分が不変で、後半部分がtickされることです。

1[3, 5,           1, 4, 2]
2^^^^^^           #######
3不変の部分     tickの部分

直感的には、その境界線はdownがFalseからTrueに変わる瞬間です。再びnext関数に戻ります：

1next (x:xs)
2    | down xs  = tick x xs
3    | otherwise = x:next xs

各再帰のとき、next (x:xs)はdown xsを計算し、先ほどの例を再利用します、

1-- 第一次再帰
2down [5, 1, 4, 2] = False
3-- 第二次再帰
4down [1, 4, 2]    = False
5-- 第三次再帰
6down [4, 2]       = True

実際、downは常にtailsの次の要素を順序に計算します：

1> tails [3, 5, 1, 4, 2]
2[[3,5,1,4,2],[5,1,4,2],[1,4,2],[4,2],[2],[]]

nextが各回使用するdown xsをあらかじめ²計算し、リストに保存します。

1import Data.List (tails)
2
3nextDown (x:xs) (d:ds)
4    | d = tick x xs
5    | otherwise = x:nextDown xs ds
6
7next xs = nextDown xs (downs xs)
8downs = drop 1 . map down . tails

もしdownsを $O(n)$ 時間内で計算できれば、問題2.は解決します。直感的には、これは非常に簡単です、なぜならdown [4, 3, 2, 1]を計算するとき、down [3, 2, 1]はすでに計算されており、それを「前回の計算」で保存し、後で使用する方法が必要だからです。

関数型プログラミングコミュニティでは、この種の問題に対する解決方法が既に存在します： scan theorem.

Scan theoremは以下を指します

1map (foldl op a) . inits = scanl op a

同様に

1map (foldr op a) . tails = scanr op a

この定理を利用して、以下にプログラムの計算過程を示します。注意、問題を避けるために、以下を定義しました

1tails' = filter (not . null) . tails

1downs = { definition }
2        drop 1 . map down . tails'
3      = { definition }
4        drop 1 . map (all (uncurry (>=)) . dup) . tails'
5      = { map distributivity }
6        drop 1 . map (all (uncurry (>=))) . map dup . tails'
7      = { need another proof (1) }
8        drop 1 . map (all (uncurry (>=))) . tails . dup
9      = { definition }
10        drop 1 . map (foldr (&&) True . map (uncurry (>=))) . tails . dup
11      = { fold-map fusion }
12        drop 1 . map (foldr join True) . tails . dup
13      = { scan theorem }
14        drop 1 . scanr join True . dup
15          where join (x, x1) r = x >= x1 && r

新たな証明が必要で、それは以下のコードが等価であることを示しています：

1> map dup $ tails' [4, 2, 3, 1]
2[[(4,2),(2,3),(3,1)],[(2,3),(3,1)],[(3,1)],[]]
3
4> tails $ dup [4, 2, 3, 1]
5[[(4,2),(2,3),(3,1)],[(2,3),(3,1)],[(3,1)],[]]

証明は省略します。

❖結論

上記の議論を組み合わせることで、効率的な関数型実装を以下に示します：

1tick x xs = build l r x
2    where (l, r) = span (> x) xs
3          build [] r x = reverse (x:r)
4          build l  r x = last l : reverse (init l ++ [x] ++ r)
5
6dup xs = zip xs (tail xs)
7downs = scanr (\(x, x1) r -> (x >= x1) && r) True . dup
8
9next xs = l ++ tick (head r) (tail r)
10    where (l, r) = splitAt (n - 1) xs
11          n = length $ takeWhile not $ downs xs

これは $O(n)$ 時間の複雑度です。しかし、私たちの定数は命令型プログラムよりも確かに大きいかもしれません。理論的には、前節で定義したnextDown関数の実装の方が効率的かもしれません（lengthとsplitAtを避ける）、しかし、私は本節で示した実装の方がより明確だと思います。

私は等価なScalaコードをleetcodeに提出しました：

1object Solution {
2    def nextPermutation(nums: Array[Int]): Unit = {
3        val nextNums = next(nums.toList).toArray
4        for (i <- nums.indices) {
5            nums(i) = nextNums(i)
6        }
7    }
8
9    def dup(xs: List[Int]): List[(Int, Int)] = xs zip xs.drop(1)
10
11    def tick(x: Int, xs: List[Int]): List[Int] = {
12        val (l, r) = xs.span(_ > x)
13        if (l.isEmpty) r.reverse ++ List(x)
14        else l.last :: (l.init ++ List(x) ++ r).reverse
15    }
16
17    def tailsDown(xs: List[(Int, Int)]): List[Boolean] = 
18        xs.scanRight(true) { case ((x, x1), r) => (x >= x1) && r }
19
20    def next(xs: List[Int]): List[Int] = {
21        val n = tailsDown(dup(xs)).takeWhile(!_).length
22        val (l, r) = xs.splitAt(n - 1)
23        l ++ tick(r.head, r.tail)
24    }
25}

「次の順列」問題は、命令型プログラムが関数型プログラムよりも簡潔になる数少ない問題の一つです。実際、HaskellのData.Permuteライブラリも、命令型の方法を使用しています。

命令型プログラムでは、上記のアルゴリズムは以下の2つのプロセスとして説明できます：

右から左に走査し、最も長い降順列a[i ... (len - 1)]を見つける
計算を行う、
- i = 0の場合、配列を反転する
- それ以外の場合、j ∈ [i, (len - 1)]を見つける、そのような
  - $a[j] > a[i - 1]$
  - $\forall k \ge i, a[k] > a[i - 1] \to a[k] \ge a[j]$ $i - 1, j$ を交換し、 $a[i \dots (\text{len - 1})]$ を反転する

上記の関数型アルゴリズムを完全に理解している読者にとっては、この命令型アルゴリズムは非常に直感的のはずです。しかし、このアルゴリズムをそのままあなたに提示し、理解できるでしょうか？

それでは、Pythonのプログラムで今日の話を締めくくりましょう！

1def swap(a, i, j):
2    tmp = a[i]
3    a[i] = a[j]
4    a[j] = tmp
5
6def rev(a, start, end):
7    l = end - start
8    for i in range(start, start + l // 2):
9        swap(a, i, end - (i - start) - 1)
10
11def solve(a):
12    for i in range(len(a) - 1, -1, -1):
13        if i >= 1 and a[i - 1] < a[i]:
14            break
15    if i == 0:
16        rev(a, 0, len(a))
17    else:
18        j = len(a) - 1
19        while j >= i and a[j] <= a[i - 1]:
20            j -= 1
21        swap(a, i - 1, j)
22        rev(a, i, len(a))