`
nesta2001zhang
  • 浏览: 68752 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

PreparedStatement效率为什么高/为什么要使用PreparedStatement代替Statement

 
阅读更多

在JDBC应用中,如果你已经是稍有水平开发者,你就应该始终以PreparedStatement代替Statement.也就是说,在任何时候都不要使用Statement.
基于以下的原因:


一.代码的可读性和可维护性.
虽然用PreparedStatement来代替Statement会使代码多出几行,但这样的代码无论从可读性还是可维护性上来说.都比直接用Statement的代码高很多档次:

stmt.executeUpdate("insert into tb_name (col1,col2,col2,col4) values ('"+var1+"','"+var2+"',"+var3+",'"+var4+"')");

perstmt = con.prepareStatement("insert into tb_name (col1,col2,col2,col4) values (?,?,?,?)");
perstmt.setString(1,var1);
perstmt.setString(2,var2);
perstmt.setString(3,var3);
perstmt.setString(4,var4);
perstmt.executeUpdate();

不用我多说,对于第一种方法.别说其他人去读你的代码,就是你自己过一段时间再去读,都会觉得伤心.


二.PreparedStatement尽最大可能提高性能.
每一种数据库都会尽最大努力对预编译语句提供最大的性能优化
.因为预编译语句有可能被重复调用.所以语句在被DB的编译器编译后的执行代码被缓存下来,那么下次调用时只要是相同的预编译语句就不需要编译,只要将参数直接传入编译过的语句执行代码中( 相当于一个函数,用就是了,不用重写一个来实现 )就会得到执行. 这 并不是说只有一个Connection中多次执行的预编译语句被缓存,而是对于整个DB中,只要预编译的语句语法和缓存中匹配.那么在任何时候就可以不需 要再次编译而可以直接执行.而statement的语句中,即使是相同一操作,而由于每次操作的数据不同所以使整个语句相匹配的机会极小,几乎不太可能匹 配.比如:
insert into tb_name (col1,col2) values ('11','22');
insert into tb_name (col1,col2) values ('11','23');
即使是相同操作但因为数据内容不一样,所以整个个语句本身不能匹配,没有缓存语句的意义.事实是没有数据库会对普通语句编译后的执行代码缓存.这样每执行一次都要对传入的语句编译一次.

当然并不是所以预编译语句都一定会被缓存,数据库本身会用一种策略,比如使用频度等因素来决定什么时候不再缓存已有的预编译结果.以保存有更多的空间存储新的预编译语句.


三.最重要的一点是极大地提高了安全性.

即使到目前为止,仍有一些人连基本的 恶义SQL语法(最好不要用拼接的方式) 都不知道.
String sql = "select * from tb_name where name= '"+varname+"' and passwd='"+varpasswd+"'";


如果我们把[' or '1' = '1]作为varpasswd传入进来.用户名随意,看看会成为什么?

select * from tb_name = '随意' and passwd = '' or '1' = '1';
因为'1'='1'肯定成立,所以可以任何通过验证.更有甚者:
把[';drop table tb_name;]作为varpasswd传入进来,则:
select * from tb_name = '随意' and passwd = '';drop table tb_name;

有些数据库是不会让你成功的,但也有很多数据库就可以使这些语句得到执行。


而如果 你使用预编译语句.你传入的任何内容就不会和原来的语句发生任何匹配的关系 .(前提是数据库本身支持预编译,但上前可能没有什么服务端数据库不支持编译了,只有少数的桌面数据库,就是直接文件访问的那些) 只要全使用预编译语句,你就用不着对传入的数据做任何过虑(因为后面传过来的只作参数用,而不参与编译,那就不会对含有sql的语句的参数再编译一次,而留下sql拼接的安全漏洞) .而如果使用普通的statement,有可能要对drop,;等做费尽心机的判断和过虑.


上面的几个原因,还不足让你在任何时候都使用PreparedStatement吗?




先指出axman 是这个坛子里少有的几个发有价值帖子的人, 但是此帖过于偏激, 可能axman为了加强语气, 强化读者印象, 但是正确性应属首位。


我 同意大多数情况下, 都可考虑使用PreparedStatement。 但是选择PreparedStatement还是Statement取决于你要怎么使用它们. 对于只执行一次的SQL语句选择Statement是最好的. 相反, 如果SQL语句被多次执行选用PreparedStatement是 <B>也许<B> 是更好的.


PreparedStatement的第一次执行消耗是很高的. 它的性能体现在后面的重复执行. 以你的例子来看:

con.prepareStatement("insert into tb_name (col1,col2,col2,col4) values (?,?,?,?)");

这时会发送一个网络请求到数据库解析和优化这个查询.


而执行时:
perstmt.executeUpdate();
会产生另一个网络请求.

诚然, PreparedStatement会有后续缓存优化查询的好处, 但是网络请求成本的增加 有可能 大于这个好处, 需要具体问题的分析。以此例来看, 90% 的可能性是若App Server 与 DB Server分布部署, 网络请求成本的增加 大于 后续优化执行带来的好处。


另外,还要指出的是, 不仅如此,
实际上Statement的执行,不一定是没有缓存的,而恰恰相反, 现在大多数的数据库软件的查询分析模块, 会透明的在第一次执行 像insert into tb_name (col1,col2) values ('11','22') 这样的sql简单语句时将其转化为 insert into tb_name (col1,col2) values (?,?), 为后面重复执行缓存优化。 当然不同的数据库实现的策略是不同的。我研究过Oracle和SQL Server, 都是这样。而且他们的文档里也都写了。


而且, 自定义动态查询等情况是绝对适合Statement的。 一个查询模块, 可选的条件有20种, 每个用户每次查询都可能大大不同( 大部分可能相同的情况下使用preparestatement是比较有用的,可以显示出不它的预编译(prepare)的好处,而大部分不同的时候,那它的优势就得不到很好的体现了 , 这时无论从编码实现(拼SQL)还是性能考虑, Statement都更适合。



>另外,还要指出的是, 不仅如此, 实际上Statement的执行,不一定是没有缓
>存的,而恰恰相反, 现在大多数的数据库软件的查询分析模块, 会透明的在>
>第一次执行 像insert into tb_name (col1,col2) values ('11','22') 这样
>的sql简单语句时将其转化为 insert into tb_name (col1,col2) values 
>(?,?), 为后面重复执行缓存优化。 当然不同的数据库实现的策略是不同
>的。我研究过Oracle和SQL Server, 都是这样。而且他们的文档里也都写了。

SQLSERVER是不是这样我不清楚,Oracle好象不完全是这样。Oracle从8i开始引入了一个配置参数,cursor_sharing。在9i中,对于cursor_sharing的取值有多了一项:similar

加入 cursor_sharing的目的,就是为了解决对statement的多次硬解析问题。其缺省值是EXACT,也就是说,只有SQL完全一样的 statement才能共享执行计划。如果把cursor_sharing的值设为FORCE,这样会强制SQL中的文字值都替换为变量。这样共享的范围 就大大扩展了。



比较赞成,看hibernate的底层sql都是用的preparestatement. 另外补充一点自己的经验. preparestatement能不能提高性能还要看数据库配置, 比如oracle,要配置指针共享参数为true,否则性能没有变化。如果配置为force的话,statement也能达到preparestatment的性能效果。
还有就是oracle的sql语句长度限制问题等都可以通过preparestatement获得解决。


同意楼上得,大多数要求尽量使用PreparedStatement,但是有些情况也得使用Statement



这个主要要从数据库角度来考虑。

你需要了解一下什么叫什么bind variable

而prepareStatement使用的正是bind variable

而bind variable并非一定是最好。如果查询条件永远是一个1,
那么。用statement
。但是一般在系统里面很少出现查询条件只是一个值的。

因此多数用PrepareStatement来说是比较好的。

大家有兴趣可以多了解了解数据库的机制。

建议看一下Thomas Kyte的expert one on one oracle



#如下,摘自oracle的电子杂志: 
执行许多SQL语句的JDBC程序产生大量的Statement和PreparedStatement对象。通常认为
PreparedStatement对象比Statement对象更有效,特别是如果带有不同参数的同一SQL语句被多次执行的时候。 PreparedStatement对象允许数据库预编译SQL语句,这样在随后的运行中可以节省时间并增加代码的可读性。

然而,在 Oracle环境中,开发人员实际上有更大的灵活性。当使用Statement或PreparedStatement对象时,Oracle数据库会缓存 SQL语句以便以后使用。在一些情况下,由于驱动器自身需要额外的处理和在Java应用程序和Oracle服务器间增加的网络活动,执行 PreparedStatement对象实际上会花更长的时间。

然而,除了缓冲的问题之外, 至少还有一个更好的原因使我们在企业应用程序中更喜欢使用PreparedStatement对象,那就是安全性 。传递给PreparedStatement对象的参数可以被强制进行类型转换,使开发人员可以确保在插入或查询数据时与底层的数据库格式匹配。

当处理公共 Web站点上的用户传来的数据的时候,安全性的问题就变得极为重要。传递给PreparedStatement的字符串参数会自动被驱动器忽略。最简单的 情况下,这就意味着当你的程序试着将字符串“D'Angelo”插入到VARCHAR2中时,该语句将不会识别第一个“,”,从而导致悲惨的失败。几乎很 少有必要创建你自己的字符串忽略代码。

在Web环境 中,有恶意的用户会利用那些设计不完善的、不能正确处理字符串的应用程序。特别是在公共Web站点上,在没有首先通过PreparedStatement 对象处理的情况下,所有的用户输入都不应该传递给SQL语句。此外,在用户有机会修改SQL语句的地方,如HTML的隐藏区域或一个查询字符串上,SQL 语句都不应该被显示出来。



我觉得easywind说的也不无道理, 特别是“ 一个查询模块, 可选的条件有20种, 每个用户每次查询都可能大大不同, 这时无论从编码实现(拼SQL)还是性能考虑, Statement都更适合




大家普遍误解PreparedStatment对象要比Statement对象效率高。毕竟,
一个prepared statement只要校验一次,而一个普通statement每次都要校验 。既然如此,在什么情况下后者会比前者效率高呢? 事实是一个prepared statement要执行65次以上才能赶上一个普通statement的执行效率。

 

再转:

何时使用statement和preparedStatement连接

JDBC 驱动的最佳化是基于使用的是什么功能. 选择PreparedStatement还是Statement取决于你要怎么使用它们。对于只执行一次的SQL语句选择Statement是最好的. 相反, 如果SQL语句被多次执行选用PreparedStatement是最好的。

   PreparedStatement的第一次执行消耗是很高的。它的性能体现在后面的重复执行。例如, 假设我使用Employee ID, 使用prepared的方式来执行一个针对Employee表的查询。JDBC驱动会发送一个网络请求到数据解析和优化这个查询,而执行时会产生另一个网 络请求。在JDBC驱动中,减少网络通讯是最终的目的。如果我的程序在运行期间只需要一次请求, 那么就使用Statement. 对于Statement, 同一个查询只会产生一次网络到数据库的通讯。

   对于使用PreparedStatement池的情况下, 本指导原则有点复杂。当使用PreparedStatement池时, 如果一个查询很特殊, 并且不太会再次执行到, 那么可以使用Statement。如果一个查询很少会被执行,但连接池中的Statement池可能被再次执行, 那么请使用PreparedStatement。在不是Statement池的同样情况下, 请使用Statement。

  使用PreparedStatement的Batch功能

   Update大量的数据时, 先Prepare一个INSERT语句再多次的执行, 会导致很多次的网络连接。要减少JDBC的调用次数改善性能, 你可以使用PreparedStatement的AddBatch()方法一次性发送多个查询给数据库. 例如, 让我们来比较一下下面的例子。

  例 1: 多次执行Prepared Statement

 

Java代码  收藏代码
  1. PreparedStatement ps = conn.prepareStatement(  
  2. "INSERT into employees values (?, ?, ?)" );  
  3.   
  4. for  (n =  0 ; n <  100 ; n++) {  
  5.   
  6. ps.setString(name[n]);  
  7. ps.setLong(id[n]);  
  8. ps.setInt(salary[n]);  
  9. ps.executeUpdate();  
  10. }   

 

  例 2: 使用Batch

 

Java代码  收藏代码
  1. PreparedStatement ps = conn.prepareStatement(  
  2. "INSERT into employees values (?, ?, ?)" );  
  3.   
  4. for  (n =  0 ; n <  100 ; n++) {  
  5.   
  6. ps.setString(name[n]);  
  7. ps.setLong(id[n]);  
  8. ps.setInt(salary[n]);  
  9. ps.addBatch();  
  10. }  
  11. ps.executeBatch();   

   在例 1中, PreparedStatement被用来多次执行INSERT语句。在这里, 执行了100次INSERT操作, 共有101次网络往返。其中,1次往返是预储statement, 另外100次往返执行每个迭代。在例2中, 当在100次INSERT操作中使用addBatch()方法时, 只有两次网络往返。1次往返是预储statement, 另一次是执行batch命令。虽然Batch命令会用到更多的数据库的CPU周期, 但是通过减少网络往返,性能得到提高。记住, JDBC的性能最大的增进是减少JDBC驱动与数据库之间的网络通讯

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics