2.9.3 使用URL Rewrite实现网站伪静态

2.9.3 使用URL Rewrite实现网站伪静态

对于以JSP为表现层开发的动态网站来说,用户访问的URL通常有如下形式

1
xxx.jsp?param=value

大部分搜索引擎都会优先考虑收录静态的HTML页面,而不是这种动态的*.jsp*.php页面。但实际上绝大部分网站都是动态的,不可能全部是静态的HTML页面,因此互联网上的大部分网站都会考虑使用伪静态——就是将*.jsp*.php这种动态URL伪装成静态的HTML页面。
对于Java Web应用来说,要实现伪静态非常简单:可以通过Filter拦截所有发向*.html请求,然后按某种规则将请求forward到实际的*.jsp页面即可。
现有的URL Rewrite开源项目为这种思路提供了实现,使用URL Rewrite实现网站伪静态也很简单。
下面详细介绍如何利用URL Rewrite实现网站伪静态。
登录http://www.tuckey.org/urlrewrite站点下载UrlRewrite的最新版本,本书成书时,该项目的最新版本是4.0.3,建议读者也下载该版本的UrlRewrite.或者到https://github.com/paultuckey/urlrewritefilter/releases下载也是可以的.

  1. 下载URL Rewrite,直接下载它的urlrewritefilter-4.0.3.jar即可,并将该JAR包复制到web应用
  2. 下载URL Rewrite,直接下载它的urlrewritefilter-4.0.3.jar即可,并将该JAR包复制到Web应用的WEB-FLib目录下。
  3. web.xml文件中配置启用URL Rewrite Filter,在web.xml文件中增加如下配置片段。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    <!-- 配置Url Rewrite的Filter -->
    <filter>
    <filter-name>UrlRewriteFilter</filter-name>
    <filter-class>org.tuckey.web.filters.urlrewrite.UrlRewriteFilter</filter-class>
    </filter>
    <!-- 配置Url Rewrite的Filter拦截所有请求 -->
    <filter-mapping>
    <filter-name>UrlRewriteFilter</filter-name>
    <url-pattern>/*</url-pattern>
    </filter-mapping>
    上面的配置片段指定使用URL RewriteFilter拦截所有的用户请求。
    在应用的WEB-INF路径下增加urlrewrite.xml文件,该文件定义了伪静态映射规则,这份伪静态规则是基于正则表达式的。

    urlrewrite.xml

    下面是本应用所使用的urlrewrite.xml伪静态规则文件。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    <?xml version="1.0" encoding="GBK"?>
    <!DOCTYPE urlrewrite PUBLIC "-//tuckey.org//DTD UrlRewrite 3.2//EN"
    "http://tuckey.org/res/dtds/urlrewrite3.2.dtd">
    <urlrewrite>
    <rule>
    <!-- 所有配置如下正则表达式的请求 -->
    <from>/userinf-(\w*).html</from>
    <!-- 将被forward到如下JSP页面,其中$1代表
    上面第一个正则表达式所匹配的字符串 -->
    <to type="forward">/userinf.jsp?username=$1</to>
    </rule>
    </urlrewrite>
    上面的规则文件中只定义了一个简单的规则:
    所有发向/userinf-(\w*).html的请求都将被forward/userinf.jsp?页面,并将(\w*)正则表达式所匹配的内容作为username参数值。

    userinfo.jsp

    根据这个伪静态规则,需要为该应用提供一个userinfo.jsp页面,该页面只是一个模拟了一个显示用户信息的页面,该页面代码如下。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    <%@ page contentType="text/html; charset=GBK" language="java" errorPage="" %>
    <%
    // 获取请求参数
    String user = request.getParameter("username");
    %>
    <!DOCTYPE html>
    <html>
    <head>
    <title> <%=user%>的个人信息 </title>
    </head>
    <body>
    <%
    // 此处应该通过数据库读取该用户对应的信息
    // 此处只是模拟,因此简单输出:
    out.println("现在时间是:" + new java.util.Date() + "<br/>");
    out.println("用户名:" + user);
    %>
    </body>
    </html>
    上面的页面中粗体字代码username请求参数来输出用户信息,但因为系统使用了URL Rewrite,因此用户可以请求类似于userinf-xxx.Html页面,图2.41显示了“伪静态”示意。