PyPDF2 DocumentInformation类

2023-03-29 11:40 更新

classPyPDF2.DocumentInformation

基类: ​

DictionaryObject

表示 PDF 文件中提供的基本文档元数据的类。可以通过​PdfReader.metadata​访问此类。

文档元数据的所有文本属性都有 两个属性,例如。​author ​和 ​author_raw​。

非原始属性将始终返回一个​TextStringObject​,这使得它非常适合显示元数据的情况。

​​如果 PyPDF2 无法解码字符串的文本编码,​raw ​属性有时会返回一个​ByteStringObject​;

这需要调用者的额外安全性,因此不经常访问。

属性 author: Optional[str]

访问文档作者的只读属性。

返回一个 unicode 字符串 ( ​TextStringObject​) 或者​None ​如果没有指定作者。

属性 author_raw: Optional[str]

作者的“原始”版本;可以返回一个​ByteStringObject 

属性 creation_date: Optional[datetime]

访问文档创建日期的只读属性。 

属性  creation_date_raw: Optional[str]

创建日期的“原始”版本;可以返回一个​ByteStringObject​.

通常采用 D:YYYYMMDDhhmmss[+-]hh'mm 格式,其中后缀是与 UTC 的偏移量。

属性 creator: Optional[str]

访问文档创建者的只读属性。

如果文档是从另一种格式转换为 PDF,则这是创建原始文档的应用程序(例如 OpenOffice)的名称。返回一个 unicode 字符串 ( ​TextStringObject​) 或者None如果没有指定创建者。

属性 creator_raw: Optional[str]

creator 的“原始”版本;可以返回一个​ByteStringObject​.

getText(key: str)→ Optional[str]

指定键的文本值或​None​。

1.28.0 版后已弃用:使用属性(例如​title​/ ​author​)。

indirect_reference: Optional[IndirectObject]

属性 modification_date: Optional[datetime]

访问文档修改日期的只读属性。

最近修改文档的日期和时间。

属性 modification_date_raw: Optional[str]

修改日期的“原始”版本;可以返回一个​ByteStringObject​.

通常采用 D:YYYYMMDDhhmmss[+-]hh'mm 格式,其中后缀是与 UTC 的偏移量。 

属性 producer: Optional[str]

访问文档的producer的只读属性。

如果文档是从另一种格式转换为 PDF,则这是将其转换为 PDF 的应用程序的名称(例如,OSX Quartz)。返回一个 unicode 字符串 ( ​TextStringObject​) 或者​None​如果未指定生产者。

属性 producer_raw: Optional[str]

生产者的“原始”版本;可以返回一个​ByteStringObject​.

属性 subject: Optional[str]

访问文档主题的只读属性。

返回一个 unicode 字符串 ( ​TextStringObject​) 或​None ​如果未指定主题。

属性 subject_raw: Optional[str]

主题的“原始”版本;可以返回一个​ByteStringObject​. 

属性 title: Optional[str]

访问文档标题的只读属性。

返回一个 unicode 字符串 ( ​TextStringObject​) 或者None 如果没有指定标题。

属性 title_raw: Optional[str]

标题的“原始”版本;可以返回一个​ByteStringObject​.

以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号