快捷搜索:  汽车  科技

php 二进制字符串文件(直接操作二进制文件)

php 二进制字符串文件(直接操作二进制文件)对于这样的需求,unpack()函数是必不可少的。在查看解决方案之前,我们快速查看一下unpack()函数本身。因此,要检查图像文件是否是有效的GIF,我们需要检查文件的头3个字节,它有“GIF”标记,然后3个字节,它给出了版本号;“87a”或“89a”。大多数二进制文件的顶部都有一个头文件,它提供关于特定文件的元信息。我们可以使用这些信息来查找文件的类型和其他信息,比如GIF文件的高度和宽度。下面显示了一个典型的原始GIF头文件,使用的是十六进制编辑器。标题的详细描述如下。

引言

PHP几乎很少处理二进制文件。但是便宜也完整的保留了这个功能。当你需要的时候,PHP自带的pack() & unpack()能能够极大地提供便利。下面我们从一个编程问题开始,讨论二进制文件的操作。

下文讨论gif文件,我们会编写一个函数,处理的内容跟GIF图像后缀无关。当然,我们也不打算尝试PHP的GD库。

php 二进制字符串文件(直接操作二进制文件)(1)

gif文件头

不使用任何与图像处理相关的函数,为了解决这个问题,我们得从GIF文件本身获取数据。

与HTML、XML或其他文本格式文件不同,GIF文件和大多数其他图像格式是以二进制格式存储的。

大多数二进制文件的顶部都有一个头文件,它提供关于特定文件的元信息。我们可以使用这些信息来查找文件的类型和其他信息,比如GIF文件的高度和宽度。

下面显示了一个典型的原始GIF头文件,使用的是十六进制编辑器。

标题的详细描述如下。

php 二进制字符串文件(直接操作二进制文件)(2)

因此,要检查图像文件是否是有效的GIF,我们需要检查文件的头3个字节,它有“GIF”标记,然后3个字节,它给出了版本号;“87a”或“89a”。

对于这样的需求,unpack()函数是必不可少的。在查看解决方案之前,我们快速查看一下unpack()函数本身。

使用unpack()函数

unpack()是pack()的补充——它根据指定的格式将二进制数据转换为关联数组。

它有点类似于sprintf,根据给定的格式转换字符串数据。

这两个函数(pack & unpack),允许我们根据指定的格式字符串读写二进制数据缓冲区。这使编程人员能够轻松地与用其他语言,或其他格式编写的程序交换数据。

举个小例子:

$data = unpack('C*' 'codediesel'); var_dump($data);

这会打印以下十进制代码的“codediesel”:

array 1 => int 99 2 => int 111 3 => int 100 4 => int 101 5 => int 100 6 => int 105 7 => int 101 8 => int 115 9 => int 101 10 => int 108

在上面的例子中,第一个参数是格式字符串,第二个参数是实际数据。

格式字符串指定应该如何解析数据参数。在本例中,格式“C”的第一部分指定我们应该将数据的第一个字符视为无符号字节。下一部分' * '告诉函数将前面指定的格式代码应用于所有剩余的字符。

乍一看上去挺混乱,但是慢慢梳理你会发现其中的规律。下一节我们提供一个具体的例子。

抓取头部数据

下面是使用unpack()函数解决GIF问题的方法。如果给定的文件是GIF格式的,则is_gif()函数将返回true。

function is_gif($image_file) { /* Open the image file in binary mode */ if(!$fp = fopen ($image_file 'rb')) return 0; /* Read 20 bytes from the top of the file */ if(!$data = fread ($fp 20)) return 0; /* Create a format specifier */ $header_format = 'A6version'; # Get the first 6 bytes /* Unpack the header data */ $header = unpack ($header_format $data); $ver = $header['version']; return ($ver == 'GIF87a' || $ver == 'GIF89a')? true : false; } /* Run our example */ echo is_gif("aboutus.gif");

需要注意的重要行是格式说明符。

' A6 '字符指定unpack()函数获取数据的前6个字节并将其解释为字符串。然后将检索到的数据存储在一个关联数组中,该数组的键名为“version”。

下面给出了另一个例子。

这将返回GIF文件的一些附加头数据,包括图像的宽度和高度。

function get_gif_header($image_file) { /* Open the image file in binary mode */ if(!$fp = fopen ($image_file 'rb')) return 0; /* Read 20 bytes from the top of the file */ if(!$data = fread ($fp 20)) return 0; /* Create a format specifier */ $header_format = 'A6Version/' . # Get the first 6 bytes 'C2Width/' . # Get the next 2 bytes 'C2Height/' . # Get the next 2 bytes 'C1Flag/' . # Get the next 1 byte '@11/' . # Jump to the 12th byte 'C1Aspect'; # Get the next 1 byte /* Unpack the header data */ $header = unpack ($header_format $data); $ver = $header['Version']; if($ver == 'GIF87a' || $ver == 'GIF89a') { return $header; } else { return 0; } } /* Run our example */ print_r(get_gif_header("aboutus.gif"));

上面的示例运行后打印以下内容。

Array ( [Version] => GIF89a [Width1] => 97 [Width2] => 0 [Height1] => 33 [Height2] => 0 [Flag] => 247 [Aspect] => 0 )

下面我们将详细讨论格式说明符的工作方式。我将分解格式,给出每个字符的详细信息。

$header_format = 'A6Version/C2Width/C2Height/C1Flag/@11/C1Aspect';

php 二进制字符串文件(直接操作二进制文件)(3)

更多格式选项可以在上图找到。

写在最后

我们展示的只是一个小小的例子,按照上图所揭示的规律,您可以任意组装成强大的解析函数。

猜您喜欢: