PreparedStatement效率为什么高/为什么要使用PreparedStatement代替Statement

nesta2001zhang

浏览: 68752 次
性别:
来自: 北京

最近访客更多访客>>

chenquanyi626

NO__ONE__

cmdjqxclb

911220wmx

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

在JDBC应用中,如果你已经是稍有水平开发者,你就应该始终以PreparedStatement代替Statement.也就是说,在任何时候都不要使用Statement.
基于以下的原因:

一.代码的可读性和可维护性.
虽然用PreparedStatement来代替Statement会使代码多出几行,但这样的代码无论从可读性还是可维护性上来说.都比直接用Statement的代码高很多档次:

stmt.executeUpdate("insert into tb_name (col1,col2,col2,col4) values ('"+var1+"','"+var2+"',"+var3+",'"+var4+"')");

perstmt = con.prepareStatement("insert into tb_name (col1,col2,col2,col4) values (?,?,?,?)");
perstmt.setString(1,var1);
perstmt.setString(2,var2);
perstmt.setString(3,var3);
perstmt.setString(4,var4);
perstmt.executeUpdate();

不用我多说,对于第一种方法.别说其他人去读你的代码,就是你自己过一段时间再去读,都会觉得伤心.

二.PreparedStatement尽最大可能提高性能.
每一种数据库都会尽最大努力对预编译语句提供最大的性能优化 .因为预编译语句有可能被重复调用.所以语句在被DB的编译器编译后的执行代码被缓存下来,那么下次调用时只要是相同的预编译语句就不需要编译,只要将参数直接传入编译过的语句执行代码中( 相当于一个函数，用就是了，不用重写一个来实现 )就会得到执行. 这并不是说只有一个Connection中多次执行的预编译语句被缓存,而是对于整个DB中,只要预编译的语句语法和缓存中匹配.那么在任何时候就可以不需要再次编译而可以直接执行.而statement的语句中,即使是相同一操作,而由于每次操作的数据不同所以使整个语句相匹配的机会极小,几乎不太可能匹配.比如:
insert into tb_name (col1,col2) values ('11','22');
insert into tb_name (col1,col2) values ('11','23');
即使是相同操作但因为数据内容不一样,所以整个个语句本身不能匹配,没有缓存语句的意义.事实是没有数据库会对普通语句编译后的执行代码缓存.这样每执行一次都要对传入的语句编译一次.

当然并不是所以预编译语句都一定会被缓存,数据库本身会用一种策略,比如使用频度等因素来决定什么时候不再缓存已有的预编译结果.以保存有更多的空间存储新的预编译语句.

三.最重要的一点是极大地提高了安全性.

即使到目前为止,仍有一些人连基本的恶义SQL语法(最好不要用拼接的方式) 都不知道.
String sql = "select * from tb_name where name= '"+varname+"' and passwd='"+varpasswd+"'";

如果我们把[' or '1' = '1]作为varpasswd传入进来.用户名随意,看看会成为什么?

select * from tb_name = '随意' and passwd = '' or '1' = '1';
因为'1'='1'肯定成立,所以可以任何通过验证.更有甚者:
把[';drop table tb_name;]作为varpasswd传入进来,则:
select * from tb_name = '随意' and passwd = '';drop table tb_name;

有些数据库是不会让你成功的,但也有很多数据库就可以使这些语句得到执行。

而如果你使用预编译语句.你传入的任何内容就不会和原来的语句发生任何匹配的关系 .(前提是数据库本身支持预编译,但上前可能没有什么服务端数据库不支持编译了,只有少数的桌面数据库,就是直接文件访问的那些) 只要全使用预编译语句,你就用不着对传入的数据做任何过虑（因为后面传过来的只作参数用，而不参与编译，那就不会对含有sql的语句的参数再编译一次，而留下sql拼接的安全漏洞） .而如果使用普通的statement,有可能要对drop,;等做费尽心机的判断和过虑.

上面的几个原因,还不足让你在任何时候都使用PreparedStatement吗?

首先指出axman 是这个坛子里少有的几个发有价值帖子的人，但是此帖过于偏激，可能axman为了加强语气，强化读者印象，但是正确性应属首位。

我同意大多数情况下，都可考虑使用PreparedStatement。但是选择PreparedStatement还是Statement取决于你要怎么使用它们. 对于只执行一次的SQL语句选择Statement是最好的. 相反, 如果SQL语句被多次执行选用PreparedStatement是 <B>也许<B> 是更好的.

PreparedStatement的第一次执行消耗是很高的. 它的性能体现在后面的重复执行. 以你的例子来看：

con.prepareStatement("insert into tb_name (col1,col2,col2,col4) values (?,?,?,?)");

这时会发送一个网络请求到数据库解析和优化这个查询.

而执行时：
perstmt.executeUpdate();
会产生另一个网络请求.

诚然， PreparedStatement会有后续缓存优化查询的好处，但是网络请求成本的增加有可能大于这个好处，需要具体问题的分析。以此例来看， 90% 的可能性是若App Server 与 DB Server分布部署，网络请求成本的增加大于后续优化执行带来的好处。

另外，还要指出的是，不仅如此，实际上Statement的执行，不一定是没有缓存的，而恰恰相反，现在大多数的数据库软件的查询分析模块，会透明的在第一次执行像insert into tb_name (col1,col2) values ('11','22') 这样的sql简单语句时将其转化为 insert into tb_name (col1,col2) values (？,？)，为后面重复执行缓存优化。当然不同的数据库实现的策略是不同的。我研究过Oracle和SQL Server，都是这样。而且他们的文档里也都写了。

而且，自定义动态查询等情况是绝对适合Statement的。一个查询模块，可选的条件有20种，每个用户每次查询都可能大大不同（大部分可能相同的情况下使用preparestatement是比较有用的，可以显示出不它的预编译（prepare）的好处，而大部分不同的时候，那它的优势就得不到很好的体现了），这时无论从编码实现（拼SQL）还是性能考虑， Statement都更适合。

>另外，还要指出的是，不仅如此，实际上Statement的执行，不一定是没有缓
>存的，而恰恰相反，现在大多数的数据库软件的查询分析模块，会透明的在>
>第一次执行像insert into tb_name (col1,col2) values ('11','22') 这样
>的sql简单语句时将其转化为 insert into tb_name (col1,col2) values
>(？,？)，为后面重复执行缓存优化。当然不同的数据库实现的策略是不同
>的。我研究过Oracle和SQL Server，都是这样。而且他们的文档里也都写了。

SQLSERVER是不是这样我不清楚，Oracle好象不完全是这样。Oracle从8i开始引入了一个配置参数，cursor_sharing。在9i中，对于cursor_sharing的取值有多了一项：similar

加入 cursor_sharing的目的，就是为了解决对statement的多次硬解析问题。其缺省值是EXACT，也就是说，只有SQL完全一样的 statement才能共享执行计划。如果把cursor_sharing的值设为FORCE,这样会强制SQL中的文字值都替换为变量。这样共享的范围就大大扩展了。

比较赞成,看hibernate的底层sql都是用的preparestatement. 另外补充一点自己的经验. preparestatement能不能提高性能还要看数据库配置，比如oracle，要配置指针共享参数为true,否则性能没有变化。如果配置为force的话，statement也能达到preparestatment的性能效果。
还有就是oracle的sql语句长度限制问题等都可以通过preparestatement获得解决。

同意楼上得，大多数要求尽量使用PreparedStatement，但是有些情况也得使用Statement

这个主要要从数据库角度来考虑。

你需要了解一下什么叫什么bind variable

而prepareStatement使用的正是bind variable

而bind variable并非一定是最好。如果查询条件永远是一个1,
那么。用statement
。但是一般在系统里面很少出现查询条件只是一个值的。

因此多数用PrepareStatement来说是比较好的。

大家有兴趣可以多了解了解数据库的机制。

建议看一下Thomas Kyte的expert one on one oracle

＃如下，摘自oracle的电子杂志：
执行许多SQL语句的JDBC程序产生大量的Statement和PreparedStatement对象。通常认为 PreparedStatement对象比Statement对象更有效,特别是如果带有不同参数的同一SQL语句被多次执行的时候。 PreparedStatement对象允许数据库预编译SQL语句，这样在随后的运行中可以节省时间并增加代码的可读性。

然而，在 Oracle环境中，开发人员实际上有更大的灵活性。当使用Statement或PreparedStatement对象时，Oracle数据库会缓存 SQL语句以便以后使用。在一些情况下,由于驱动器自身需要额外的处理和在Java应用程序和Oracle服务器间增加的网络活动，执行 PreparedStatement对象实际上会花更长的时间。

然而，除了缓冲的问题之外，至少还有一个更好的原因使我们在企业应用程序中更喜欢使用PreparedStatement对象,那就是安全性。传递给PreparedStatement对象的参数可以被强制进行类型转换，使开发人员可以确保在插入或查询数据时与底层的数据库格式匹配。

当处理公共 Web站点上的用户传来的数据的时候，安全性的问题就变得极为重要。传递给PreparedStatement的字符串参数会自动被驱动器忽略。最简单的情况下，这就意味着当你的程序试着将字符串“D'Angelo”插入到VARCHAR2中时，该语句将不会识别第一个“，”，从而导致悲惨的失败。几乎很少有必要创建你自己的字符串忽略代码。

在Web环境中，有恶意的用户会利用那些设计不完善的、不能正确处理字符串的应用程序。特别是在公共Web站点上,在没有首先通过PreparedStatement 对象处理的情况下，所有的用户输入都不应该传递给SQL语句。此外，在用户有机会修改SQL语句的地方，如HTML的隐藏区域或一个查询字符串上，SQL 语句都不应该被显示出来。

我觉得easywind说的也不无道理，特别是“ 一个查询模块，可选的条件有20种，每个用户每次查询都可能大大不同，这时无论从编码实现（拼SQL）还是性能考虑， Statement都更适合 ”

大家普遍误解PreparedStatment对象要比Statement对象效率高。毕竟，一个prepared statement只要校验一次，而一个普通statement每次都要校验。既然如此，在什么情况下后者会比前者效率高呢？事实是一个prepared statement要执行65次以上才能赶上一个普通statement的执行效率。

再转：

何时使用statement和preparedStatement连接

JDBC 驱动的最佳化是基于使用的是什么功能. 选择PreparedStatement还是Statement取决于你要怎么使用它们。对于只执行一次的SQL语句选择Statement是最好的. 相反, 如果SQL语句被多次执行选用PreparedStatement是最好的。

　　PreparedStatement的第一次执行消耗是很高的。它的性能体现在后面的重复执行。例如, 假设我使用Employee ID, 使用prepared的方式来执行一个针对Employee表的查询。JDBC驱动会发送一个网络请求到数据解析和优化这个查询，而执行时会产生另一个网络请求。在JDBC驱动中，减少网络通讯是最终的目的。如果我的程序在运行期间只需要一次请求, 那么就使用Statement. 对于Statement, 同一个查询只会产生一次网络到数据库的通讯。

　　对于使用PreparedStatement池的情况下, 本指导原则有点复杂。当使用PreparedStatement池时, 如果一个查询很特殊, 并且不太会再次执行到, 那么可以使用Statement。如果一个查询很少会被执行,但连接池中的Statement池可能被再次执行, 那么请使用PreparedStatement。在不是Statement池的同样情况下, 请使用Statement。

　　使用PreparedStatement的Batch功能

　　Update大量的数据时, 先Prepare一个INSERT语句再多次的执行, 会导致很多次的网络连接。要减少JDBC的调用次数改善性能, 你可以使用PreparedStatement的AddBatch()方法一次性发送多个查询给数据库. 例如, 让我们来比较一下下面的例子。

　　例 1: 多次执行Prepared Statement

Java代码

PreparedStatement ps = conn.prepareStatement(
"INSERT into employees values (?, ?, ?)" );
for (n = 0 ; n < 100 ; n++) {
ps.setString(name[n]);
ps.setLong(id[n]);
ps.setInt(salary[n]);
ps.executeUpdate();
}

　例 2: 使用Batch

Java代码

PreparedStatement ps = conn.prepareStatement(
"INSERT into employees values (?, ?, ?)" );
for (n = 0 ; n < 100 ; n++) {
ps.setString(name[n]);
ps.setLong(id[n]);
ps.setInt(salary[n]);
ps.addBatch();
}
ps.executeBatch();

　　在例 1中, PreparedStatement被用来多次执行INSERT语句。在这里, 执行了100次INSERT操作, 共有101次网络往返。其中,1次往返是预储statement, 另外100次往返执行每个迭代。在例2中, 当在100次INSERT操作中使用addBatch()方法时, 只有两次网络往返。1次往返是预储statement, 另一次是执行batch命令。虽然Batch命令会用到更多的数据库的CPU周期, 但是通过减少网络往返，性能得到提高。记住, JDBC的性能最大的增进是减少JDBC驱动与数据库之间的网络通讯

分享到：

ORACLE CHAR,VARCHAR,VARCHAR2,NVARCHAR类 ... | sendfile原理，实现文件传输性能的提升

2011-08-09 11:15
浏览 3960
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论