msgbartop
平凡的生活,默默的期待,等待蜕变的到来……
msgbarbottom

12 一 10 中文汉字的正则字符编码范围

中文编码范围,中文汉字的正则也许用的着。

双字节字符编码范围:

1. GBK (GB2312/GB18030)

1
2
3
4
\x00-\xff GBK双字节编码范围
\x20-\x7f ASCII
\xa1-\xff 中文gb2312
\x80-\xff 中文 gbk

2. UTF-8 (Unicode)

1
2
3
4
\u4e00-\u9fa5 (中文)
\x3130-\x318F (韩文)
\xAC00-\xD7A3 (韩文)
\u0800-\u4e00 (日文)

27 十一 09 PHP完整删除文件夹函数

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
/**
 * 删除指定目录
 *
 * @param string $dirname 路径
 * @return void
 */
function rmdir_rf($dirname) {
	if ($dirHandle = opendir($dirname)) {
		chdir($dirname);
		//该处很多地方都写$file = readdir($dirHandle)),当$file = 0时,函数失效
		while (false !== ($file = readdir($dirHandle))) {
			if ($file == '.' || $file == '..') continue;
			if (is_dir($file))rmdir_rf($file);
			else unlink($file);
		}
		chdir('..');
		rmdir($dirname);
		closedir($dirHandle);
	}
}

该函数在PHP手册中有人写过,但当while语句中的遍历写的有点小问题,在使用中发现函数失效,就随后记下来吧,好像一年多没更新过博客了,惭愧……

Tags: ,

27 四 08 Snoopy中文手册(毛毛虫翻译)

1
2
3
4
5
6
7
/**
 * @name Snoopy手册中文版
 * @author 毛毛虫 wangchong1985@gmail.com
 * @version Snoopy - the PHP net client v1.2.2
 * @link http://www.wangchong.org
 * @since 2008-04-27
 */

名称:

Snoopy – the PHP net client v1.2.2

概要:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
 
	include "Snoopy.class.php";
	$snoopy = new Snoopy;
 
	$snoopy->fetchtext("http://www.php.net/");
	print $snoopy->results;
 
	$snoopy->fetchlinks("http://www.phpbuilder.com/");
	print $snoopy->results;
 
	$submit_url = "http://lnk.ispi.net/texis/scripts/msearch/netsearch.html";
 
	$submit_vars["q"] = "amiga";
	$submit_vars["submit"] = "Search!";
	$submit_vars["searchhost"] = "Altavista";
 
	$snoopy->submit($submit_url,$submit_vars);
	print $snoopy->results;
 
	$snoopy->maxframes=5;
	$snoopy->fetch("http://www.ispi.net/");
	echo "\n";
	echo htmlentities($snoopy->results[0]);
	echo htmlentities($snoopy->results[1]);
	echo htmlentities($snoopy->results[2]);
	echo "\n";
 
	$snoopy->fetchform("http://www.altavista.com");
	print $snoopy->results;

描述:

Snoopy是什么?

Snoopy是一个php类,用来模仿web浏览器的功能,它能完成获取网页内容和发送表单的任务。

Snoopy的一些特点:

* 方便抓取网页的内容
* 方便抓取网页的文本内容 (去除HTML标签)
* 方便抓取网页的链接
* 支持代理主机
* 支持基本的用户名/密码验证
* 支持设置 user_agent, referer(来路), cookies 和 header content(头文件)
* 支持浏览器转向,并能控制转向深度
* 能把网页中的链接扩展成高质量的url(默认)
* 方便提交数据并且获取返回值
* 支持跟踪HTML框架(v0.92增加)
* 支持再转向的时候传递cookies (v0.92增加)
(全文 …)

Tags: , ,

11 四 08 仿QQ等级显示函数

开头先引述下QQ等级的算法:
设当前等级为N,达到当前等级最少需要的活跃天数为D,当前活跃天数为Dc,升级剩余天数为Dr,则:

mimetex.gif

从而推出:

mimetex1.gif

好了,引述完成,懒得写字了,贴出代码:


< ?php
/**
*
* showRank.php
* QQ等级输出类库
* @author 毛毛虫
* @version 1.0 2008-04-09
*
*/
class showRank {

/**
* 第一级图片显示字段
*/
public $mImage1;

/**
* 第二级图片显示字段
*/
public $mImage2;

/**
* 第三级图片显示字段
*/
public $mImage3;

/**
* 构造函数:传入图片值
* @return 无
*/
function __construct($pImage1 = ‘★’,$pImage2 = ‘▲’,$pImage3 = ‘●’) {
$this->mImage1 = $pImage1;
$this->mImage2 = $pImage2;
$this->mImage3 = $pImage3;
}

/**
* 根据活跃天数计算用户等级。(模仿QQ的升级方式)
* @return int
* @access public
*/
function get_rank($pScore) {
$temp = $pScore+4;
$tRank = sqrt($temp)-2;
$tRank = floor($tRank);
return $tRank;
}

/**
* 用户等级标志,根据用户等级显示用户标志
* 仿照QQ等级的四进制显示
* @return str
* @access public
*/
function get_score($pScore) {
$str = ”;
$tRank = $this->get_rank($pScore);//根据分数取得等级
$tPicNum = base_convert($tRank,10,4);//转化为四进制
$tPicNum = strrev($tPicNum);//翻转字符串
$tArray = str_split($tPicNum);//转化为数组
$tNum = count($tArray);
if($tNum< =3) {
for($i=$tNum-1;$i>=0;$i–){
switch($i){
case ’0′:
for($j=0;$j< $tArray[$i];$j++){
$str .= $this->mImage1;
}
break;
case ’1′:
for($j=0;$j< $tArray[$i];$j++){
$str .= $this->mImage2;
}
break;
case ’2′:
for($j=0;$j< $tArray[$i];$j++){
$str .= $this->mImage3;
}
break;
default:
//$str = ;
break;
}
}
}else {
$str = $this->mImage3.$this->mImage3.$this->mImage3.$this->mImage3;
}
return $str;

}

}
?>

(全文 …)

Tags: ,

12 二 08 PHP实现‘服务器推’(flush函数使用)

最近一直在做自己的图书站,分别使用过杰奇和读吧两套不同的系统,对于这两套系统也是又爱又恨,爱的是他们的功能强大,恨他们都同属没有开源精神的产物。呵呵,作为一名穷程序员,俺可以理解作者的苦衷,这里就不批判了。
年假期间,无事可做,翻看自己以前的采集代码,发现很多可以优化和提升的地方,就简单做了下优化,其中也使用了用户体验更加优秀的服务器推技术,这里简单的介绍下核心的函数:flush。
(全文 …)

Tags: , , ,

02 二 08 杰奇小说连载系统sitemap生成插件

最近为自己的书站最终选择了杰奇小说连载系统,但是这个系统并不是开源的程序,无法自由修改,很是不爽,但熟悉了几天后,还是忍不住做些扩展的开发,这是我写的一个sitemap的生成程序,在这里放出来给大家用用吧。
sitemap.php

$txt_name=’sitemap.xml’;
writeStatistic_set_name($txt_name);
$sql=”select * from jieqi_article_article “;
$db->query($sql);
for($i=1;$i<= $db->num_rows();$i++){
$db->next_record();
$siteid = $db->f(siteid);
$articleid = $db->f(articleid);
$url = “
http://www.iobug.com/files/article/html/$siteid/$articleid/index.html
“;
writeStatistic($url,$txt_name);
}
$db->free();
$over=’‘;
writeStatistic($over,$txt_name);
print ““;
exit;

杰奇小说连载系统sitemap生成插件下载:
杰奇小说sitemap生成插件下载

Tags: , , ,

02 二 08 snoopy与htmlsql实例(盗墓笔记采集)

snoopy这个采集类库是个很好玩的东西,简单而且使用,一般的采集应付起来绰绰有余。
最近一个哥们要看盗墓笔记的全本TXT文档,让我帮他采集,想了下决定用snoopy和一个好玩的类库htmlsql来做,htmlsql第一次使用,感觉比较好玩,写SQL的感觉非常有趣,就是灵活性上不是很突出,但做这种小的采集足够了,可能是因为第一次使用这个类库,并不是很顺利,写了两个多钟头,才搞定这个采集,这里放出源码供大家下载吧,想玩玩的可以拿去参考下。
展示部分代码:

include_once("./snoopy.class.php");
include_once("./htmlsql.class.php");
require_once("./function.php");
//防止页面超时
set_time_limit(0);
//生成文本文档名称
$name="怒海潜沙";//自定义文件名(注意自己修改)
$txt_name=$name.".txt";
$zhangjie="nu-hai-qian-sha";//这个程序写的并不是很智能,每个章节的链接地址还要自己修改下(注意自己修改)
$max="46";//最大采集章节数(注意自己修改)
$wsql = new htmlsql();
for($i=1;$i<=$max;$i++){
$a=sprintf("%02d", $i);
$url="http://www.daomubiji.com/$zhangjie-$a.html";
// connect to a URL
if (!$wsql->connect(‘url’, $url)){
print ‘Error while connecting: ‘ . $wsql->error;
exit;
}

if(!$wsql->query(‘SELECT * FROM h1′)){
print “Query error: ” . $wsql->error;
exit;
}

// show results:
foreach($wsql->fetch_array() as $row){
writeStatistic(“\r\n”.$row['text'].”\r\n”,$txt_name);
$echo=iconv(“UTF-8″, “GBK”, $row['text']);
//print_r($row);
}

$wsql->isolate_content(‘‘,’

‘);

if (!$wsql->query(‘SELECT * FROM *’)){
print “Query error: ” . $wsql->error;
exit;
}

// show results:
foreach($wsql->fetch_array() as $row){
writeStatistic(strip_tags($row['text']).”\r\n”,$txt_name);
//print_r($row);
}
print “$i. 章节: $echo 采集完成…..
“;
print “——————————————————–
“;
flush();
}
print “卷:$name 全部采集完成……”;
?>

程序包下载:
snoopy与htmlsql实例程序包

Tags: , , , ,

24 一 08 mysql出错表

1005:创建表失败
1006:创建数据库失败
1007:数据库已存在,创建数据库失败
1008:数据库不存在,删除数据库失败
1009:不能删除数据库文件导致删除数据库失败
1010:不能删除数据目录导致删除数据库失败
1011:删除数据库文件失败
1012:不能读取系统表中的记录
1020:记录已被其他用户修改
1021:硬盘剩余空间不足,请加大硬盘可用空间
1022:关键字重复,更改记录失败
1023:关闭时发生错误
1024:读文件错误
1025:更改名字时发生错误
1026:写文件错误
1032:记录不存在
1036:数据表是只读的,不能对它进行修改
1037:系统内存不足,请重启数据库或重启服务器
1038:用于排序的内存不足,请增大排序缓冲区
1040:已到达数据库的最大连接数,请加大数据库可用连接数
1041:系统内存不足
1042:无效的主机名
1043:无效连接
1044:当前用户没有访问数据库的权限
1045:不能连接数据库,用户名或密码错误
1048:字段不能为空
1049:数据库不存在
1050:数据表已存在
1051:数据表不存在 (全文 …)

Tags: ,

17 一 08 用PHP取得文件后缀名的两个办法

1、pathinfo函数:

$name = 'http://www.wangchong.org/ad_banner-1199957657.gif';
$path_parts = pathinfo($name);
echo $path_parts['extension'];
?>

2、end函数:

$name = 'http://www.wangchong.org/ad_banner-1199957657.gif';
echo(end(explode(".",$name)));
?>

Tags: ,

29 十二 07 Apache服务器配置技巧

Apache服务器配置技巧
本文简要介绍了十几个Apache 的配置技巧:
  1、如何设 置请求等待时间

  在httpd.conf里面设置:

  TimeOut n

  其中n为整数,单位是秒。

  设置这个TimeOut适用于三种情况:

  2、如何接收一个get请求的总时间
(全文 …)

Tags: , ,

Pages: 1 2 3 Next