CSV

CSV

文件格式
逗号分隔值(CSV)文件包含以純文本形式列出的表中的數據,例如電子郵件聯系方式。雖然CSV文件可以用很多程序打開,比如文本編輯器,但是它們包含的數據最好使用電子表格程序來查看,比如Microsoft Excel、OpenOffice Calc或Google Sheets。[1]
  • 中文名:CSV
  • 外文名:Comma Separated Values
  • 别名:逗号分隔值
  • 應用:在程序之間轉移表格數據

用法

CSV是一種通用的、相對簡單的文件格式,被用戶、商業和科學廣泛應用。最廣泛的應用是在程序之間轉移表格數據,而這些程序本身是在不兼容的格式上進行操作的(往往是私有的和/或無規範的格式)。因為大量程序都支持某種CSV變體,至少是作為一種可選擇的輸入或輸出格式。

例如,一個用戶可能需要交換信息,從一個以私有格式存儲數據的數據庫程序,到一個數據格式完全不同的電子表格。最可能的情況是,該數據庫程序可以導出數據為“CSV”,然後被導出的CSV文件可以被電子表格程序導入。

“CSV”并不是一種單一的、定義明确的格式(盡管RFC4180有一個被通常使用的定義)。因此在實踐中,術語“CSV”泛指具有以下特征的任何文件:純文本,使用某個字符集,比如ASCII、Unicode、EBCDIC或GB2312;由記錄組成(典型的是每行一條記錄);每條記錄被分隔符分隔為字段(典型分隔符有逗号、分号或制表符;有時分隔符可以包括可選的空格);每條記錄都有同樣的字段序列。

在這些常規的約束條件下,存在着許多CSV變體,故CSV文件并不完全互通。然而,這些變異非常小,并且有許多應用程序允許用戶預覽文件(這是可行的,因為它是純文本),然後指定分隔符、轉義規則等。如果一個特定CSV文件的變異過大,超出了特定接收程序的支持範圍,那麼可行的做法往往是人工檢查并編輯文件,或通過簡單的程序來修複問題。因此在實踐中,CSV文件還是非常方便的。

規則

開頭是不留空,以行為單位。可含或不含列名,含列名則居文件第一行。一行數據不跨行,無空行。以半角逗号(即,)作分隔符,列為空也要表達其存在。列内容如存在半角逗号(即,)則用半角雙引号(即"")将該字段值包含起來。列内容如存在半角引号(即")則應替換成半角雙引号("")轉義,并用半角引号(即"")将該字段值包含起來。文件讀寫時引号,逗号操作規則互逆。内碼格式不限,可為ASCII、Unicode或者其他。不支持特殊字符。

規範

逗号分隔列出日期之前,盡早從個人電腦,但被廣泛應用于最早前IBM個人電腦時代的個人電腦磁帶存儲備份和交換的信息的數據庫機器的兩種不同的架構。在這一天,負擔得起的硬盤驅動器不存在,和許多小型企業試圖實現效益的計算使用軟盤的軟件。

CSV沒有通用标準規範。不同的程序間CSV的标準有差異很常見,這可能導緻交互操作困難。互聯網通信的CSV文件,資料的IETF文件(符合RFC4180于2005年10月)介紹了格式的“text/csv格式”MIME類型登記的IANA負責。另一個相關的規格是由派出文字其中也包括CSV格式。許多非正式文件的存在,說明CSV格式。如何:逗号分隔值(CSV)文件格式概述了CSV格式中使用最廣泛的應用和解釋它如何能最好地利用和支持。

相關詞條

相關搜索

其它詞條