文件蒐證中使用[預測編碼]的機遇

資訊科技最適合用於文件較密集的複雜大型案件,特別是因為部分文件需由律師團隊進行審查,律師團隊是「蒐證」過程的專題專家。

文件審查是訴訟/仲裁程序和電子蒐證調查過程中,人力最密集且成本最高的階段。法律專業人員根據相關性、反應度、法律特權和機密度規則審查文件。律師對每頁資料進行審查和分析,以決定向對方保留哪些文件免於披露。合規專業人員對電子蒐證參考模型的理解至關重要。本文分析如何應用[預測編碼]技術來優化文件收集、檢索、傳遞、分析和展示。

《實務指引》SL1.2(簡稱「實務指引」)提供了「商業案件審訊表中案件電子儲存文件的透露及提供之試驗計劃」。實務指引考慮了技術輔助審查(「TAR」)和其他自動搜索方法,提出了供法庭使用文件的「合理、相稱和經濟的蒐證」框架,亦鼓勵雙方就符合比例和具成本效益的電子文件蒐證方法達成
協議。

資訊科技與文件審查法例

視乎具體情況,「文件」包含以民事訴訟程序規則接受的方式記錄、持有或儲存的敏感性法律資料,擴展到電子文件形式,包括電子郵件和文字信息。文件審查員擁有法律科技背景,審查與未決訴訟和監管調查相關的文件。他們亦可總結、標貼、強調、製表和收集從文件中收集的某些文件或信息,以及建立權限和編輯日誌。

文件審查員/律師主要是支援訴訟的律師、律師助理或顧問,因為信息受律師與客戶特權、保密規則和私隱法例約束,否則就不能拒絕提供。例如,若文性涉及製造過程的商業秘密,法律團隊沒有義務把文件交給對方。有時文件涉及個人資料隱私,審核人員會建議編輯文件的某些部分,以保障客戶的個人私隱。

由於文件審核人員的工作講求速度和效率,必須具備強烈職業道德,並願意按時完成任務以降低客戶的成本。借助先進的資訊及通訊科技,文件獲「編碼和剔除」後加入訴訟資料庫,以縮小供審查文件的數量。數百萬份文件,如備忘錄、信件、電子郵件、PPT演示文稿檔案、電子表格和其他電子文檔必須在緊迫的時限內審查,以便配合內部調查和訴訟程序中乎合的蒐證要求(如盤問或審查出示證物)。

電子蒐證的不同搜索方法:為何不用關鍵字搜索?預測編碼機遇說明

電子蒐證因不同的搜索方法而異。首先,電子搜索關鍵詞具本身存在偏見,因此自然排除了一部分相關文件,或者因而需要審查更多無關的文件。相反,使用預測編碼進行搜索,通常由資深律師查看示例文件的「種子集」形式建立演算方法,演算方法分析文件特徵、判例、律師的決策,然後識別類似的文件,並根據相關可能性進行排序。即使文件由第三方實質擁有,法庭也會下令披露這些文件。

現時,法院沒有限制使用特定的搜索方法。但長遠來說,預測編碼搜查似乎會佔優。預測編碼是在電腦科學領域使用〈人工智能〉研發所得。在此過程中,排序最高的文件可優先進行審查。這種審查持續至系統未能得其他相關文件,或相關性文件的比例對比上會變得很低,以致繼續進行審查不符合按次
比例。

Brown v BCA Trading Ltd [2016] EWHC 1464一案中,司法常務官Jones批准使用預測編碼來識別可能相關的文件審查。法院裁定,與〈關鍵詞〉和〈人工〉搜索方法相比,預測編碼的成本較低(視乎文件量),因為使用預測編碼是較為合理的。在Pyrrho Investments Ltd & anr v MWB Property Ltd & ors [2016] EWHC 256 (Ch)一案中,法院已表明「最佳做法是由一位負責主管案件的高級律師把關考慮整個[教學]樣本的法律問題」。

Triumph Controls UK Ltd & Ors v Primus International Holding Co & Ors [2018] EWHC 165 (TCC)中,法官Coulson認為(a)預測編碼仍未受到認受或該程度或不如前。因它只取決於了解所涉及事實和法律問題的專家的意見。因此,預測編碼很少在第一輪就完美地分類搜查到所有資料。因此,律師和客戶仍需審查和檢查該電腦程式的結果,以確保正確地搜索出所需的文件,沒有搜出不應搜出的文檔,尤其是包含法律特權或商業敏感資料的文件。

美國法院傾向採取更自由的方式來選擇電子搜索方法。正如Hyles v New York City, 2016 WL 4077114, at *2-3 (Mag. S.D.N.Y. Aug. 1, 2016)及Re Viagra (Sildenafil Citrate) Products Liability Litigation, 2016 WL 7336411, at *1 (Mag. N.D. Cal. Oct. 14, 2016)一案指出,法院或請求方不得強迫答辯方使用TAR。請求方有權決定「選擇使用的搜索方法」。

在實踐中,大家很難強制使用預測編碼。研究傾向於顯示,人手審查決定相關性可能不那麼一致。預測編碼的以下優點與缺點應予以考慮:

綜合而言,使用預測編碼結合傳統的電子蒐證方法:審查大量文檔,能提高可靠度和效率。更多商業和專業律師行在內部使用這種科術,避免僱用外面供應商,減少外判電子蒐證過程的時間,降低客戶的
成本。

預測編碼也適用於處理社交媒體的不同信息形式,如照片、視頻、電子郵件和其他通信(例如微信和WhatsApps上線通知),這些非結構化的資料類型在電子蒐證中越來越普遍。

Cowen Group最近的一項調查顯示:律師行已「使用過一種以上的預測編碼工具/搜索方法,律師行有能力內部處理資料,並可繞過供應商」。預測編碼是重要的蒐證科技創新,所以全球越來越多法律人員使用。在大數據時代,法律和合規專業人員必須接受培訓,懂得選擇最適合案件的搜索科技,確保以具經濟效益的方式管理案件。

Jurisdictions: 

FCIS, FCS, LLM, FHKIArb張元洪律師行律師

陳蘇完是一名高度嫻熟的律師、仲裁員和特許秘書,在私人執業和公司內部、講學與大學行政管理以及競爭合規培訓方面具有廣泛的經驗。自2010年以來,她一直教授、研究和發表有關數碼取證的法律和專業方面的內容,作為她在倫敦米德爾塞克斯大學(Middlesex University London)和香港大學專業進修學院(HKUSPACE)電子安全和數碼取證碩士的一部分工作。該課程獲英國電腦協會(British Computer Society)的特許資訊科技專業人士(CITP)資格認證。