所以在過去的兩個星期,我分別從兩個不同的客戶,得知 muyueh.com 被內部網路所擋住。兩次的原因都是相同的:內部網路做了一次網站的掃描,發現裡面含有「sex」這一個字眼,所以就把整個網域所擋掉了。
(我的客戶所看到的畫面)
我自己也很好奇,畢竟這一個網站從頭到尾都是我寫的,怎麼突然被歸類為色情網站了?在網路上強制搜尋,可以得到這樣的結果:
被擋掉的字,sex 的前後文是 sex ratio,英文性別比的意思。因為我有一張圖,是關於立法委員性別比的消長。兩次的客戶都是因為有一些信任基礎了,所以願意回報給我知道。或許有發生過更多的案例,是潛在客戶看到頁面後,心想,這感覺是什麼不正當的網站就關掉了。
所以我原本的圖,是想要推動性別平等,結果被誤認為是色情相關的網頁。我的問題只是冰山的一角,因為 sex ratio 是一個正式用詞。所以表示其實全世界有關於性別平等的網站都會被封鎖,台灣在推動性別平等,但我們把全世界關於性別平等的知識都封鎖起來了。
我一直在思考當中到底是哪一個環節出錯了。最直接的錯誤,當然是跟英文程度低落有關係。誤以為 "sex" 就是性交,所以載有的網站應該是上班不宜。但在中文我們不會犯這一個錯誤,我們不會把「性」放到我們系統濾網裡面,因為很多詞彙都會用到,比方說「屬性」,所以我們有直覺會知道這一個字本身是中立的。
我們的英文程度太低弱了,我們沒有一個直覺知道「sex」也是一個中立的字,並且會用在很多其他的字詞裡面。
假如我們把這一個問題在抽象化一些,在這一個案例上,當然出錯的地方是英文程度低弱。但一個更大的問題是:我們所瀏覽的網站應該要被過濾嗎?在這兩個例子,管理者為了要保護上班效率,所以封鎖了一些網站。但其實還有更多的例子:包含裝在家裡的色情管理員。還有影響我們所有人的:網路中立性的討論。在我們所有人的生活中,政府可以因為侵權或其它的疑慮,將一些網站封鎖。反對封鎖的運動,叫做網路中立性,想法就是不應該就任何網頁的內容而限制其使用。
所以過濾可以提高工作效率、保護小孩不接受色情、保護智慧財產權,相較起來,一個自由的網路似乎沒有那麼重要。但問題的核心,在於:「當你現在的過濾機制一定有問題的時候,我們應該要犯哪一種錯誤?」:
- 假陽性的錯誤就像是我這一次網站的例子,其實無關色情,但是被完全封鎖了。知道過少的錯誤。
- 假陰性的錯誤,是其實是色情,可是沒有被分類成功。知道過多的錯誤。
或許你會說:「但過濾機制可以改進,我們只要把 sex ratio 設定是例外就好了」。但除非你要假設我們的系統可以完全不犯錯,不然你還是應該要回答這樣的問題:我們到底應該要犯哪一種錯誤,寧願「不堪」的內容,還是寧願錯過一些重要的內容。講不堪真的重了些,但實際上我們現在就被「不堪」的東西轟炸著,當然不是很理想,但有這麼可怕嗎?
我寧願承受不堪的內容,也不要錯過重要的內容。今天我還只是知道我錯過了什麼重要的內容,明天我會連我錯過什麼東西都不知道。我們可以承受一整個國家的人,連錯過什麼東西我們都不知道嗎?現在討論的還是一個善良但愚蠢的管理者,但想像管理者假如有一天變成邪惡的,我們應該賦予任何人如此的權利嗎?
這一篇文章原本是要給管理者看的,遺憾本文出現了 sex、sex ratio、性交、色情等關鍵字,可惜假如你活在泡泡之中的話,你永遠不知道自己現在正在犯什麼樣的錯誤。