为什么要使用模糊检索?
有时对一个特定的主题进行研究的时候能否得到全面的数据是非常关键的。但是四库目前提供的全文检索做不到这一点。原因有以下两点:
一、检索内容同检索条件有差异,其原因是古人在写书时会在一些词语中增加或减少一些虚词,如“之、而、其、所、以、也”,还会改变一些实词,如“兵”和“师”。
二、数字过程中造成的一些录入错误。
这样就不可能把数据都查出来。使用模糊检索可以较好的解决这个问题。例子如下:
● 检索词:不战而屈人之兵
使用模糊检索得到的不同匹配:
不战而屈人兵
不战屈人兵
不战屈人之
不战而屈人之兵
不战而屈之
不战而屈人
不战而屈人之
不战而壊人之
不战屈人之兵
不废而昔人之兵
不战而诎人兵
不战而屈是之
不能分人之兵
不战而胜人之
战而屈人之兵
不战而疲人兵
不以战屈人之兵
不战以屈人兵
● 检索词:水能载舟亦能覆舟
使用模糊检索得到的不同匹配:
水能载舟亦能覆舟
水水能载舟亦能覆舟
水能载舟亦能溺舟
水以载舟亦以覆舟
水可载舟亦以覆舟
水能浮舟亦能覆舟
能载舟亦能覆舟
载舟亦能覆舟
水能泛舟亦能覆舟
水也能载舟亦能覆舟
水能行舟亦能覆舟
水能乗舟亦能覆舟
水能济舟亦能覆舟
● 检索词:百闻不如一见
使用模糊检索得到的不同匹配:
百闻不如一见
闻不如一见
百书不如一见
百闻不若一见
百闻不及一见
百闻不如见