了解 JavaScript 函数式编程目录
类型签名
初识类型
JavaScript 是一种动态的类型语言,但这并不意味着要否定类型的使用。我们日常打交道的主要就是字符串、数值、布尔值等。虽然 JavaScript 语言成面上没有相关的集成。不过我们可以使用类型签名生成文档,也可以使用注释帮助我们区分类型。
有些朋友应该使用过一些 JavaScript 类型检查工具,比如 Flow 或者 是其他的静态类型检测语言类如 TypeScript。
Hindley-Milner 类型签名
类型签名是一个非常常用的系统,我们可以从很多计算机语言系统上看到它的使用,下面来看个栗子:
// capitalize :: String -> Stringvar capitalize = function(s){ return toUpperCase(head(s)) + toLowerCase(tail(s));}capitalize("smurf");//=> "Smurf"复制代码
这里的
capitalize
接受一个String
并返回了一个String
。这里我们不关心实现函数过程,我们只关注它的类型签名
在 Hindley-Milner
系统中,函数都写成类似 a -> b
这个样子,其中 a
和 b
是任意类型的变量。因此,capitalize
函数的类型签名可以理解为“一个接受 String
返回 String
的函数”。换句话说,它接受一个 String
类型作为输入,并返回一个 String
类型的输出。
看看一些函数签名
// strLength :: String -> Numbervar strLength = function(s){ return s.length;}// join :: String -> [String] -> Stringvar join = curry(function(what, xs){ return xs.join(what);});// match :: Regex -> String -> [String]var match = curry(function(reg, s){ return s.match(reg);});// replace :: Regex -> String -> String -> Stringvar replace = curry(function(reg, sub, s){ return s.replace(reg, sub);});复制代码
strLength
和 capitalize
类似:接受一个 String
然后返回一个 Number
。
具体来看看 match 函数
对于 match 函数,我们完全可以把它的类型签名这样分组:
// match :: Regex -> (String -> [String])var match = curry(function(reg, s){ return s.match(reg);});复制代码
是的,把最后两个类型包在括号里就能反映更多的信息了。现在我们可以看出 match
这个函数接受一个 Regex
作为参数,返回一个从 String
到 [String]
的函数。因为curry
,造成的结果就是这样:给 match
函数一个 Regex
,得到一个新函数,能够处理其 String
参数。当然了,我们并非一定要这么看待这个过程,但这样思考有助于理解为何最后一个类型是返回值。
// match :: Regex -> (String -> [String])// onHoliday :: String -> [String]var onHoliday = match(/holiday/ig);复制代码
每传一个参数,就会弹出类型签名最前面的那个类型。所以 onHoliday
就是已经有了 Regex
参数的 match
。
// replace :: Regex -> (String -> (String -> String))var replace = curry(function(reg, sub, s){ return s.replace(reg, sub);});复制代码
但是在这段代码中,就像你看到的那样,为 replace
加上这么多括号未免有些多余。所以这里的括号是完全可以省略的,如果我们愿意,可以一次性把所有的参数都传进来;所以,一种更简单的思路是:replace
接受三个参数,分别是 Regex
、String
和另一个 String
,返回的还是一个 String
。
如果你使用过 TypeScript 来看看下面的改写
// capitalize :: String -> Stringlet capitalize = (s: String): String => { toUpperCase(head(s)) + toLowerCase(tail(s));}// match :: Regex -> (String -> [String])let match = curry((reg:RegExp, s:String): string[] =>{ s.match(reg);});复制代码
可以看到 TypeScript 的语法更加易于理解不需要注释大家应该也能明白输入和输出的类型,我们可以知道 TypeScript 是借鉴类类似于类型签名的思想去做的类型检测,以至于我们使用 JavaScript 的时候更加的方便。
- 具体的 TypeScript 基础的函数类型定义可以看看我的文章
缩小可能性范围 narrowing of possibility
一旦引入一个类型变量,就会出现一个奇怪的特性叫做 parametricity( )。这个特性表明,函数将会以一种统一的行为作用于所有的类型。我们来研究下:
// head :: [a] -> a复制代码
注意看 head
,可以看到它接受 [a]
返回a
。我们除了知道参数是个数组,其他的一概不知;所以函数的功能就只限于操作这个数组上。在它对 a
一无所知的情况下,它可能对 a
做什么操作呢?换句话说,a
告诉我们它不是一个特定的类型,这意味着它可以是任意类型;那么我们的函数对每一个可能的类型的操作都必须保持统一。这就是 parametricity
的含义。要让我们来猜测 head
的实现的话,唯一合理的推断就是它返回数组的第一个,或者最后一个,或者某个随机的元素;当然,head
这个命名应该能给我们一些线索。 再看一个例子:
// reverse :: [a] -> [a]复制代码
仅从类型签名来看,reverse
可能的目的是什么?再次强调,它不能对 a
做任何特定的事情。它不能把 a
变成另一个类型,或者引入一个 b
;这都是不可能的。那它可以排序么?答案是不能,没有足够的信息让它去为每一个可能的类型排序。它能重新排列么?可以的,我觉得它可以,但它必须以一种可预料的方式达成目标。另外,它也有可能删除或者重复某一个元素。重点是,不管在哪种情况下,类型 a
的多态性(polymorphism)都会大幅缩小 reverse
函数可能的行为的范围。
这种“可能性范围的缩小”(narrowing of possibility)允许我们利用类似 Hoogle
这样的类型签名搜索引擎去搜索我们想要的函数。类型签名所能包含的信息量真的非常大。
自由定理 free theorems
类型签名除了能够帮助我们推断函数可能的实现,还能够给我们带来自由定理(free theorems)。来看一个栗子
// head :: [a] -> acompose(f, head) == compose(head, map(f));复制代码
例子中,等式左边说的是,先获取数组的第一个元素,然后对它调用函数 f;等式右边说的是,先对数组中的每一个元素调用 f,然后再取其返回结果的头部。这两个表达式的作用是相等的,但是前者要快得多。
在 JavaScript 中,你可以借助一些工具来声明重写规则,也可以直接使用 compose 函数来定义重写规则。总之,这么做的好处是显而易见且唾手可得的,可能性则是无限的。如果这里不太明白 compose 的使用的话,可以翻到前面看看 code compose 的文章解释
类型约束
最后要注意的一点是,签名也可以把类型约束为一个特定的接口(interface)。
// sort :: Ord a => [a] -> [a]复制代码
双箭头左边表明的是这样一个事实:a 一定是个 Ord 对象。也就是说,a 必须要实现 Ord 接口。Ord 到底是什么?它是从哪来的?在一门强类型语言中,它可能就是一个自定义的接口,能够让不同的值排序。通过这种方式,我们不仅能够获取关于 a 的更多信息,了解 sort 函数具体要干什么,而且还能限制函数的作用范围。我们把这种接口声明叫做类型约束(type constraints)。
// assertEqual :: (Eq a, Show a) => a -> a -> Assertion复制代码
这个例子中有两个约束:Eq 和 Show。它们保证了我们可以检查不同的 a 是否相等,并在有不相等的情况下打印出其中的差异。 我们将会在后面的章节中看到更多类型约束的例子,其含义也会更加清晰。
总结
Hindley-Milner
类型签名在函数式编程中无处不在,它们简单易读,写起来也不复杂。但仅仅凭签名就能理解整个程序还是有一定难度的,要想精通这个技能就更需要花点时间了。当然现在是推荐大家使用 TypeScript
,用了就回不去的好玩物。