无论哪种语言,字符串操作都是一个重要的基础,往往是简单而重要。正像人说话一样,一般有形体(图形界面),有语言(print 字符串),显然字符串能解释更多的东西。PHP提供了大量的字符串操作函数,功能强大,使用也比较简单。
弱类型
PHP是弱类型语言,所以其它类型的数据一般可以直接应用于字符串操作函数里,而自动转换成字符串类型,进行处理,如: echo substr(“1234567”, 1, 3);
和echo substr(123456,1, 3);
是一样的。
字符串的定义:
一般用双引号或单引号标识一个字符串。比如
$str = “i love php”;
$str = ‘i love php’;
它者两者是有一些区别的。后者将一切单引号的内容都会当作字符处理;前者则不然。比如
$test = “iwind”;
$str = “i love $test”;
$str1 = ‘i love $test’;
echo $str;
//将得到 i love iwind
echo $str1;
//将得到 i love $test
同样的以下两个例子的行为也不一样的:
echo “i love test”;
// 将得到 i love est,已经将t视为转义
echo ‘i love test’;
// 将得到 i love test
从而可以简单认为双引号里的内容是经过“解释”过的,单引号的是“所见即所得”的。显而易见,双引号形式的更为灵活一些,当然单引号会适用于一些特殊的场合,这里就不作阐述了。
字符串的输出:
PHP里的输出最常用的是echo,print.两者都不是真正的函数,而是语言构造,所以调用时不必用双括号(比如echo(“test”);
print(“test”))。在输出的时候两者都可以实现赋值:
echo $str=”test”;
//一方面输出test,一方面把”test”赋给字符串变量 $str
print $str=”test”;
两者除了名字不一样外,还是有其它区别的。print具有返回值,一直返回1,而echo没有,所以echo比print要快一些:
$
return = print “test”;
echo $return;
// 输出1
也正因为这个原因,print能应用于复合语句中,而echo不能:
isset($str) or print “str 变量未定义”;
// 将输出”str 变量未定义”
isset($str) or echo “str 变量未定义”;
// 将提示分析错误
echo一次可输出多个字符串,而print则不可以:
echo “i “,”love “,”iwind”;
// 将输出 “i love iwind”
print “i “,”love “,”iwind”;
// 将提示错误
echo,print还可以输出被称作“文档句法”的字符串,句法如:
echo <<<标签名称
…
字符串内容
…
标签名称;
比如
echo <<<test
i love iwind
test;
要注意的是语句开始和结束的两个标签名称是一样的,且后一个标签名称前不能有空白,即要顶格写。文档句法输出的内容识别变量名称和常用符号,大致形同双引号的作用。
除echo、print输出外,PHP还提供了一些格式化字符串的函数,比如printf,sprintf,vprintf,vsprintf,在这里不作详解。
字符串的连接:
两个以上的字符串连接用”.”操作符,依字符串的顺序形成新的字符串。
$str = “i ” . “love ” . “iwind”;
这里的$str 就是 “i love iwind”;
字符串。当然,还可以使用 .= 操作符:
$str = “”;
// 初始化
$str .= “i love iwind”;
这里用到了初始化,是因为未定义变量在使用时会产生一个notice错误,””或者null可以简单地代表空字符串。
长度
PHP提供strlen函数来计算字符串的长度:
$str = “test”;
echo strlen($str);
// 将输出 4
有点奇怪的是strlen将中日等汉字以及全角字符都当作两个或四个长度计算。好在mbstring或icon两个函数可以帮助解决这个问题,比如:
$len = iconv_strlen($str, “GBK”);
$len = mb_strlen($str, “GBK”);
注:mbstring模块提供了大量的对含有多字节字符的字符串的处理函数,推荐多加应用,由于这篇文章讲的是字符串入门,所以不打算详细解说。
分隔与连接:
PHP允许你把一个字符串按照一个分隔符分隔成一个数组,或者将一个数组组合成一个字符串。看下面的例子:
$str = “i love iwind”;
$array = explode(” “, $str);
上面的explode函数,就把$str字符串按空格字符进行分隔,结果返回一个数组 $array:array(“i”, “love”, “iwind”).与explode函数有类似功能的有:preg_split(), spliti(), split()等函数。
与此相反的,implode和join则能把一个数组结合成一个字符串,他们是具有完全相同功能的函数。
$array = array(“i”, “love”, “iwind”);
$str = implode(” “, $array);
例子中的implode函数将数组$array的每个元素用空格字符进行连接,返回一个字符串 $str: “i love iwind”.
裁剪:
1、去空格:
一个字符串首和尾的空格,可能不是你想要的部分,就可以用trim,rtrim,ltrim等函数,分别去除一个字符串两端空格,一个字符串尾部空格,一个字符串首部空格。
echo trim(” i love iwind “);
// 将得到 “i love iwind”
echo rtrim(” i love iwind “);
// 将得到 ” i love iwind”
echo ltrim(” i love iwind “);
// 将得到 “i love iwind “
其实这三个参数不仅可以去除字符串首尾的空格,还可以去除它们的第二个参数指定的字符,如:
echo trim(“,1,2,3,4,”, “,”);
// 将得到 1,2,3,4 两端的”,”号被裁掉了。
有时还会看到有人使用chop这个函数,其实它是rtrim的同义函数。
2、字符串截取
string substr(obj string,
int start,
int [length]);
取部份字符串。
本函数将字符串 string 的第 start 位起的字符串取出 length 个字符。若 start 为负数,则从字符串尾端算起。若可省略的参数 length 存在,但为负数,则表示取到倒数第 length 个字符。
string strrchr(obj string, string needle);
取得某字符最后出现处起的字符串。
本函数用来寻找字符串 haystack 中的字符 needle 最后出现位置,并将此位置起至字符串 haystack 结束之间的字符串返回。若没有找到 needle 则返回 false。
string strstr(string haystack, string needle);
返回字符串中某字符串开始处至结束的字符串。
本函数将 needle 最先出现在 haystack 处起至 haystack 结束的字符串返回。若找不到 needle 则返回 false。
另外,PHP5以后提供了很多针对多字节字符处理的函数,它们以“mb_”开头,详见PHP手册
大小写转换:
对于英文字母来说,可以用strtoupper,strtolower将其转变成大写或小写。
echo strtoupper(“i love iwind”);
// 将得到 I LOVE IWIND
echo strtolower(“I LOVE IWIND”);
// 将得到 i love iwind
一般可以用 !=, == 比较两个对象是否相等,之只所以说是两个对象,是因为它们不一定全部为字符串,也可以为整型等等。比如
$a = “joe”;
$b = “jerry”;
if ($a != $b)
{
echo “不相等”;
}
else
{
echo “相等”;
}
如果用 !==,===(可以看到多了一个等号)比较的话,两个对象的类型要严格相等才能返回true;
否则用==,!=则会将字符串自动转换成相应的类型,以便进行比较.
22 == “22”;
// 返回 true
22 === “22”;
// 返回false,正因为这样,所以我们的程序时常会发生一些想不到的”意外”:
0 == “我爱你”;
// 返回true
1 == “1 我爱你”;
// 返回true
PHP里还有这样一组用于字符串比较的函数:strcmp,strcasecmp,strncasecmp(), strncmp(),它们都是如果前者比后者大,则返回大于0的整数;如果前者比后者小,则返回小于0的整数;如果两者相等,则返回0.它们比较的原理与其它语言的规则都是一样的。
字符串比较
Strcmp(str1,str2)是用于区分大小写(即大小写敏感)的字符串比较,相同为返回0,str1>str2返回>0的正整数,str1<str2返回<0的负整数:
echo strcmp(“abcdd”, “aBcde”);
// 返回 1 (>0), 比较的是 “b”和”B”
strcasecmp用于不区分大小写的字符串比较:
echo strcasecmp(“abcdd”, “aBcde”);
// 返回 -1 (<0), 比较的是”d”和”e”
strncmp用于比较字符串的一部分,从字符串的开头开始比较,第三个参数,为要比较的长度:
echo strncmp(“abcdd”, “aBcde”, 3);
// 返回 1 (>0), 比较了 abc 和 aBc
strncasecmp用于不区分大小写的比较字符串的一部分,从字符串的开头开始比较,第三个参数,为要的比较长度:
echo strncasecmp(“abcdd”, “aBcde”, 3);
// 返回 0, 比较了 abc 和 aBc,
由于不区分大小写,所以两者是相同的。
还有一种情况是单单比较字符串大小,达不到我们预定的要求,比如照常理 10.gif 会比 5.gif 大,但如果应用上面几个函数,就会返回 -1,即表示 10.gif比5.gif,针对这种情况,PHP提供了两个自然对比的函数strnatcmp,strnatcasecmp:
echo strnatcmp(“10.gif”, “5.gif”);
// 返回 1 (>0)
echo strnatcasecmp(“10.GIF”, “5.gif”);
// 返回 1 (>0)
替换:
替换的意义在于将一个字符串的一部分进行改变,使之成为别外一个新的字符串,以满足新的要求。PHP里通常用str_replace(“要替换的内容”, “要取代原内容的字符串”, “原字符串”)进行替换。
echo str_replace(“iwind”, “kiki”, “i love iwind, iwind said”);
// 将输出 “i love kiki, kiki said”
即将 原字符串中的所有”iwind”都替换成了”kiki”.
str_replace是大小写敏感的,所以对你不能设想用 str_replace(“IWIND”, “kiki”,…)替换原字符串中的”iwind”.
str_replace还可以实现多对一,多对多的替换,但无法实现一对多的替换:
例:echo str_replace(array(“iwind”, “kiki”), “people”, “i love kiki, iwind said”);
将会输出i love people, people said,第一个参数中的array(“iwind”, “kiki”)都被替换成了”people”
例:echo str_replace(array(“iwind”, “kiki”), array(“gentle man”, “ladies”), “i love kiki, iwind said”);
输出 i love ladies, gentle man said 。也就是说第一个数组中的元素被第二个数组中的相对应的元素替换掉了,如果有一个数组比另一个数组元素数要少,那么不足的都会当作空来处理。
不区分大小写的的字符串替换函数:str_ireplace(),参数与str_replace()相同。
与此有些类似的是strtr函数。语法: string strtr(string str, string from, string to);
本函数将字符串 str 中和 from 有关的字符一一转成 to 的字符。
此外,PHP还提供了substr_replace,实现替换一部分的字符串。语法如下:
substr_replace (原字符串, 要替代的字符串, 开始替换的位置 [, 替换的长度])
其中,开始替换的位置从0开始计算,应该小于原字符串的长度。要替换的长度是可选的。
echo substr_replace(“abcdefgh”, “DEF”, 3);
// 将输出 “abcDEF”
echo substr_replace(“abcdefgh”, “DEF”, 3, 2);
// 将输出 “abcDEFfgh”
第一个例子中,从第三个位置(即”d”)开始替换,从而把 “defgh”都替换成了“DEF”
第二个例子中,也是从第三个位置(即”d”)开始替换,但只能替换2个长度,即到e,所以就把”de”替换成了”DEF”.
PHP还提供了preg_replace,preg_replace_callback,ereg_replace,eregi_replace等函数应用正则表达式来完成字符串替换,用法请参考手册。
查找与匹配
PHP里用于查找或者匹配或者定位的函数非常多,它们都有不同的意义。这里只讲述用得比较多的strstr,stristr用来提取,返回值都一样,只是不区分大小写。 如果未找到则返回FALSE。
strstr(“母字符串”, “子字符串”)用来查找子字符串在母字符串中第一次出现的位置,并返回母字符串中从子字符串开始到母字符串结束的部分。比如
echo strstr(“abcdefg”, “e”);
//将输出 “efg”
如果找不到子字符串,则返回空。因此可以用来判断一个字符串中是否含有另外一个字符串:
$needle = “iwind”;
$str = “i love iwind”;
if (strstr($str, $needle))
{
echo “里面有 iwind”;
}
else
{
echo “里面没有 iwind”;
}
将会输出”里面有 iwind”
其它字符串查找相关函数:
strpos($str,search,[int]):查找search在$st中的第一次位置从int开始,区分大小写,未找到返回FALSE;
stripos($str,search,[int]):查找search在$str中的第一次位置int开始,不区分大小写,未找到返回FALSE
strrpos($str,search,[int]):查找search在$str中的最后一次出现的位置从int开始,未找到返回FALSE。
统计子字符串出现的次数:
substr_count(string,substring[,start,length])
string必要参数,指定字符串对象;substring必要参数,指定需要进行搜索的子字符串;start可选参数,指定位于字符串中开始搜索的起始位置;length可选参数,指定搜索的长度。
在特殊字符前加反斜线,使其成为转义字符:
string addslashes(string);
被转义的字符:这些字符是单引号(’)、双引号(”)、反斜线()与 NUL(NULL 字符)。
一个使用 addslashes() 的例子是当你要往数据库中输入数据时。例如,将名字 O’reilly 插入到数据库中,这就需要对其进行转义。大多数据库使用 作为转义符:O’reilly。这样可以将数据放入数据库中,而不会插入额外的 。
去除反斜线函数:
string stripslashes(string);
本函数可去掉字符串中的反斜线字符。若是连续二个反斜线,则去掉一个,留下一个。若只有一个反斜线,就直接去掉。
与上面加反斜线和去除反斜线函数相似的还有一个很实用的函数,就是mysql_real_escape_string()函数,还有一个mysqli_real_escape_string()函数,语法格式如下:
mysql_real_escape_string(string,[dblink]);
功能:转义 SQL 语句中使用的特殊字符。也就是在特殊字符前加反斜线。也可用于二进制数据。主要用于insert和update时的字符串。比如,要将一个二进制数据存入BLOB类型的字段中,就要先用这个函数对要写入的二进制数据进行转义操作。
说明,在使用此函数之时,如果被转义的字符是从客户端提交过来的,要用get_magic_quotes_gpc()函数检测一下你的PHP是否已经开启了自动在特殊字符前加反斜线的功能,如果已经开启了,那么在使用这个函数前要用stripslashes()函数把反斜线去掉,然后再用这个函数对数据进行转义。
string参数必须,是要进行转义的字符,dblink是数据库连接名称,如$conn等。
受到影响的字符:\x00 ,n ,r , ,’,” ,\x1a
求字符的ASCII码
ord(字符);
求ASCII码对应的字符
chr(ASCII);
HTML相关
1、htmlspecialchars($string)
这是它的最简单用法,将字符串中的一些特殊字符(顾名思义)&
,’,”<,>转换成它们对应的HTML实体形式:
$str = “i love <
font color=”red”>kiki</font>, iwind said.”;
echo htmlspecialchars($str);
将会输出
i love &
lt;
font color=&
quot;
red&
quot;
&
gt;
kiki&
lt;
/font&
gt;
, iwind said.
2、htmlspecialchars_decode(字符串)
htmlspecialchars的反解码,即将实体字符转换为标准ASCII字符。
3、htmlentities($string)
将所有能转换成实体形式的字符都转换成实体形式。
4、html_entity_decode($string);
PHP4.3.0以后加入的具有与htmlentities($string)相反的功能。
5、nl2br($string)
将字符串中所有换行符转变成<br />+ 换行符。如:
$str = “i love kiki,n iwind said.”;
echo nl2br($str);
将会输出
i love kiki,<br />
iwind said.
加密
加密字符串最常用的就是md5了,它将一个字符串转换成一个长32位的唯一的字符串。
echo md5(“i love iwind”);
// 将输出 “2df89f86e194e66dc54b30c7c464c21c”
PHP5给md5加了第二个参数,从而使它可以输出16位的加密后的字符串。