法律科技:eDiscovery 解釋及分析

存儲成本下降,企業和個人電子存儲信息(ESI)數量大幅增長,而ESI的類型和網絡流動速度也大大增加(例如Global Yellow Pages Limited v. Promedia Directories Pte Ltd and another suit [2013] SGHC 111, para 1)。正如新加坡高等法庭法官李兆堅所說:「電子信息量大,某些類型的電子信息難以獲取,對訴訟查證領域帶來相當大的挑戰。」這些發展觸發了對先進科技的巨大需求,以便利現今的訴訟、仲裁及內部和規管調查中複雜而大型的文件透露工作(eDiscovery)。

香港、新加坡以及一些其他普通法司法管轄區的訴訟人受到有關eDiscovery的法院規則約束。例如,香港高等法院《實務指示》SL1.2條要求商業案件審訊表的訴訟各方和他們的法律代表在首次案件管理會議之前商討如何運用科技進行電子文件透露,包括「為了減輕進行電子文件透露的辛勞和費用而應考慮使用的工具和技術(如有的話)」及「保存電子文件」。要遵守這些規則,各方必須了解eDiscovery科技和技術,並以合理的方式和比例使用它們。

越來越多普通法和大陸法司法管轄區採用eDiscovery來進行複雜的大型文件披露工作。雙方只能以符合成本效益和法律規定的方式進行,同時適當地管理法律和操作風險,如果他們了解eDiscovery操作的相關問題。本文概述eDiscovery項目須注意的事項及當前的科技和技術。

計劃審閱和製作

eDiscovery的主要目標,是識別和製作非特權文件,回應傳票、文件披露請求或內部調查需求,並保留非相關和/或具有法律特權的文件。案例小組應仔細考慮文件審查和製作的法律、操作和技術要求。相關問題包括:是否需要製作原生文件?包含文本的圖像文件是否必須轉換為可搜索格式?這是否可行?是否需要保存元數據?

違反法證原則收集的ESI,或未經正確處理和分析的ESI,可能會浪費大量成本和時間,尤其是太遲才發現問題,導致需要重複進行eDiscovery程序。在更糟糕的情況下,案例小組可能會錯過截止日期,不慎製作了特權文件,或者保留了應該披露的相關文件。

傳統技術和工具

項目開始時,ESI必須收集、處理並管理一個組織良好的數據庫。將實體文件掃描轉換為ESI,並使用光學字符識別軟件,令文本可作搜索。處理涉及聚合統一不同類型的ESI(例如電子郵件、聊天消息、Word文檔、PDF和音頻文件),使它們成為結構化和可搜索的數據。 處理工具還可以剔除重複和損壞的文件,以及包含電腦生成內容的文件。建立文件庫供人工審閱後,在開始審閱前,可以將文件庫分為不同的批次和工作流程,確定優先次序,進一步細化以提高效率,最終降低審閱成本。

潛在的響應性和非響應性文件庫,是根據其保管人及創建和修改時間及其他屬性過濾文件,並使用可能具響應性的特定法律和事實的關鍵字組合搜索而創建的。文件可按語言分類,以助具適當語言技能的案例小組人員管理審閱流程。可通過對文件進行分組,超過50%相似度為一組,並將同一對話的電子郵件通信組合起來(包括對話的分支),以使審閱達至更高的一致性和速度。語言檢測、接近重複分析和電子郵件往來是當今eDiscovery審閱平台常見的工具,有助於加速和自動化某些審閱程序。

通過分析自動化並加速審閱

傳統的技術和工具有其局限。在搜索關鍵字時,審閱者實質上是在猜測響應性文件作者使用的單詞。但是,這些關鍵字搜索結果可能會不足(如因為審閱者不知道作者採用的某些變化和區域用語,及可能拼寫錯誤,而忽略了一些文檔)或者過度(如關鍵字搜索得出非響應性文件,因為可能使用了與情況不相干的文字)。例如,包含「蘋果」的文檔可能與同名的公司和水果有關,但只有公司名可能會對案例作出響應。

最新的分析軟件可提高搜索結果的精確度,最大程度地減少誤差。該軟件可將文檔分組,通過其中重複的詞語進行自我識別、分類和概念化,傳統的Boolean strings和模糊搜索將難以識別。審閱者可以已經人手識別的文件作為樣本,讓軟件找出「概念上」類似的文件。 同樣,審閱可用摘要和響應性文本段落摘錄來「教導」軟件搜索。

幾種先進的eDiscovery軟件提供「預測編碼」功能,澳洲、英國、愛爾蘭和美國的法院已將確認該工具適用於涉及大量ESI的案件(見例如Pyrrho Investments Ltd & Another v MWB Property Limited & Others [2016] EWHC 256 (Ch); McConnell Dowell Constructors (Aust) Pty Ltd v Santam Ltd (No 1) [2016] VSC 734.)。使用機器學習演算法,基於上述的分析框架,預測編碼軟件可識別響應性案例的文檔並設置優先順序。人手審閱文檔樣本用於訓練軟件識別文本的模式或「概念」。經過幾輪人手審閱後,軟件得到充分訓練,審閱了足夠的樣本。然後,軟件將根據他們對某些「概念」的響應性進行文檔排序。然後,審閱人員可以人手檢查/審閱排名高的文檔,容後處理甚至忽略排名低的文檔。

結合傳統和先進的eDiscovery科技和技術,案例小組可以進行大規模的ESI審閱和製作,同時確保分析的質量和一致性,盡量減少錯誤風險,並有效管理成本和時間。

Jurisdictions: 

埃貝,區域總監兼高級法律顧問

Mr. Ko現時領導埃貝在亞洲的文件審查服務,其中包括埃貝在大中華區、印度和日本辦事處的審查小組,並在區域內提供機構內部的法律支援,尤其是在數據保護合規方面,並獲認許在香港和美國紐約執業。埃貝為法律界提供全球性的綜合技術服務,包括電子透露、法庭報告以及有關監管和合規。

經理,埃貝

Mr. Yuen是埃貝在亞洲的文件審查服務部的經理,主要負責大中華區市場及支援該區域內的電子透露項目,並獲認許在美國加州執業。埃貝在全球有30個地點為律師事務所、公司、金融機構和政府機構提供服務。