Haskell:理解惰性求值与运算符优先级

Xilong Yang
2022-01-08

CIS 194 HomeWork6时遇到了各种思维方面的困难。试图通过梳理它们加深对运算符优先级和惰性求值的理解。

引言:Fibonacci数列

斐波那契数列,相信大家都很熟悉了,每个人刚接触递归与动态规划的思想时候都会看到它的身影。其定义为:

fib(1) = 1
fib(2) = 1
fib(n) = fib(n - 1) + fib(n - 2), n > 2

这在Haskell中是很容易实现的:

fib :: Integer -> Integer
fib 1 = 1
fib 2 = 1
fib n = fib (n - 1) + fib (n - 2)

fib函数的递推实现

不难看出,上面的实现非常自然,几乎与数学方式给出的定义一样。然而大家可能都知道,这种定义方式的计算效率是很低的,在过程式语言中可以引出DP思想:

int fib(int n) {
    int fibs[n] = {1,1};
    for (int i = 2; i < n; ++i) {
        fibs[i] = fibs[i - 1] + fibs[i - 2];
    }
    return fibs[n - 1];
}

这样的计算方法将可能重复使用的资源记录了下来,使用少量空间换取了大量的时间。并且也很符合人的直觉。可以拆解成两步:

  1. 维护一个长度至少为n的数列。
  2. 取出数列中对应的元素。

那么在Haskell这样的无副作用语言中如何实现对列表的维护呢?如果使用下面方式:

fibs :: [Integer]
fibs = map fib [1..]

则不仅无法使用这个列表记录已使用的计算,反而每一步都要耗费大量的计算资源。这里如果根据直觉实现递推,或许会实现出这样的东西:

fibs :: [Integer]
fibs = map fib' [1..]
    where
        fib' 1 = 1
        fib' 2 = 1
        fib' n = fibs!!(n - 1) + fibs!!(n - 2)

然而,这样会寻致计算!!的时候试图求出fib的值,因此会进入一个死循环。不可行。

那么我们在Lecture 6中见过的Data.Array可以完成这个任务吗?答案是不行,它仅仅是一个对列表的封装,本身不支持处理无限列表。且此处并不需要使用映射。

黔驴技穷了,上网搜索解法,发现可以使用zipWith实现如下:

fibs :: [Integer]
fibs = 1:1:zipWith (+) fibs (tail fibs)

于是开始了我的迷惑之旅。

惰性求值

对于fibs = 1:1:zipWith (+) fibs (tail fibs)这种形式的定义,我简直闻所未闻。定义中不仅出现了自身,甚至出现了对自身的嵌套运算。将上式转换为C++形式可以帮助我们快速发现蹊跷:

// 1:1:zipWith (+) fibs (tail fibs) == (:) (1) ((:) (1) (zipWith (+) fibs (tail fibs)))
list cons(Num i, list tail);
list zipWith(operation op, list a, list b);
list tail(list l);
list fibs() {
    return cons(1, cons(1, zipWith(plus, fibs(), tail(fibs()))));
}

可以发现一个很明显的问题,这个函数没有递归终止条件。而在C++这样的直接求值语言中,这会导致传参时无限递归,计算不出任何结果。然而对于惰性求值的Haskell而言,就不存在这个问题了,首先看看zipWith的定义:

zipWith :: (a->b->c) -> [a] -> [b] -> [c]
zipWith f = go
  where
    go [] _ = []
    go _ [] = []
    go (x:xs) (y:ys) = f x y : go xs ys

由于这个函数没有用到如!!length这类需要先将值计算出来的函数,符合惰性求值的作用条件,计算过程如下:

fibs = 1:1:zipWith (+) fibs (tail fibs)
 == 1:1:(go (1: (1:ys))
 == 1:1:((1 + 1) : xs : ys)
 == 1:1:((1 + 1) : tail fibs : tail (tail fibs))
 ...

可以总结出一条规律,要想使用惰性求值特性,就要使每一个计算步骤都不依赖完整的结果。

谈谈运算符优先级

这里的答案是:运算符是cons函数的语法糖,而[emelments]又是:的语法糖,关系如下:

[1,2,3] == 1:2:3:[] == cons 1 (cons 2 (cons 3 []))

不难看出,为满足这个关系,:是一个右结合运算符。因此:

1:1:(zipWith (+) fibs (tail fibs))
== 1:(1:((zipWith (+) fibs (tail fibs))))
== 1:(1:(zipWith (+) fibs (tail fibs)))
== 1:1:zipWith (+) fibs (tail fibs)

之所以可以将zipWith (+) fibs (tail fibs)看做一个整体,是因为前缀函数调用的优先级高于中缀函数。

而不可以将zipWith (+) fibs (tail fibs)写做zipWith (+) fibs tail fibs,则是因为前缀函数调用优先级相同,且从左向右开始分析。因此上式等价于:(zipWith (+) fibs tail) fibs

根据$运算符的作用是“省略之后的括号”来理解,这样写是可行的,然而这个理解是错误的。$运算符真正的作用是,将前后两部分都括上括号。因此上式转换为前缀写法后,错误就显而易见了,如下:

($) (1:1:zipWith (+) fibs) (tail fibs)
($) (cons 1 (cons 1 (zipWith (+) fibs))) (tail fibs)

值得一提的是$的函数原型:

($) :: (a -> b) -> a -> b
($) = id

即接受一个函数,然后返回该函数本身。唯一的作用就是用其极低的运算优先级来省略多余的括号。没错,是极低的优先级,这有违直觉。因为直觉上似乎是:$运算符以极高的运算优先级为它的左右两边加上了括号”。然而我们不妨思考一下,括号的意义正是优先运算,为了让自己的左右都先于自己运算,它的优先级必然很低。(事实上$的运算优先级是最低的一级,参见后附优先级表。)

考虑以下例子:

f :: a -> b
g :: c -> a

f g x == (f g) x
f $ g x /= ((f $) g) x
map + [1] /= map (+) [1]

为什么同样是占据高优先级函数的参数位置,中缀运算符不会被当作参数传递呢?因为当我们使用中缀函数时,实际上表达式会被当作等价的前缀形式来处理,即:

f $ g x == ($) (f) (g x) == ($ f) (g x) == f (g x) -- 注意:当转换为前缀形式后,由于所有的函数都成为了前缀函数,不再有优先级一说。
map + [1] == (+) (map) ([1]) == (+ map) ([1]) -- 错误:函数(+ map)参数类型与[]不匹配。

上例也可看出,所谓的优先级只在中缀表达式到前缀表达式的转换中有效,即:

(f.g) x == ((.) f g) (x)
f.g $ x == ($) (f.g) (x) == ($) ((.) f g) (x)
1 + 2 * 3 + 4 
  == (+) (1 + 2 * 3) + (4) 
  == (+) ((+) (1) (2 * 3)) (4) 
  == (+) ((+) (1) ((*) 2 3)) 4

这里又可看出一个有趣的规律:优先级不同的运算符先转换较低级的,同级的运算符则根据结合律来决定顺序(转换顺序与结合顺序相反)。即后运算的先转换。

这种将中缀函数转换成前缀的方式可以帮助我们理解两个内容:

  1. 运算符优先级。
  2. 引用中缀函数时要加上括号。

附:运算符优先级表

+--------+----------------------+-----------------------+-------------------+
| Prec-  |   Left associative   |    Non-associative    | Right associative |
| edence |      operators       |       operators       |    operators      |
+--------+----------------------+-----------------------+-------------------+
| 9      | !!                   |                       | .                 |
| 8      |                      |                       | ^, ^^, **         |
| 7      | *, /, `div`,         |                       |                   |
|        | `mod`, `rem`, `quot` |                       |                   |
| 6      | +, -                 |                       |                   |
| 5      |                      |                       | :, ++             |
| 4      |                      | ==, /=, <, <=, >, >=, |                   |
|        |                      | `elem`, `notElem`     |                   |
| 3      |                      |                       | &&                |
| 2      |                      |                       | ||                |
| 1      | >>, >>=              |                       |                   |
| 0      |                      |                       | $, $!, `seq`      |
+--------+----------------------+-----------------------+-------------------+
autorenew
© 2019- Xilong Yang | CC BY-NC 4.0 | Powered by LaTeX.css, Prism, MathJax