基于索引性能分析的情报信息管理系统研究

来源：叨叨游戏网

２０１２年２月　计算机工程与设计　ＣＯＭＰＵＴＥＲ　ＥＮＧＩＮＥＥＲＩＮＧ　ＡＮＤ　ＤＥＳＩＧＮ　Ｆｅｂ．２０１２　Ｖｏ１．３３　Ｎｏ．２　第３３卷第２期　基于索引性能分析的情报信息管理系统研究　曾传军，傅秀芬　（广东工业大学计算机学院，广东广州５１０００６）　摘要：在系统开发数据库应用中，通常由于一条ＳＱＬ语句的问题占用了大部分的资源，使得后续的会话无法正常快速的　执行。这类问题中一部分是开发人员在ＳＱＬ编写时，没有考虑对表建索引，忽视了索引在性能方面的作用，以致系统性能　提不上。以电子政务情报信息管理系统为应用研究背景，使用Ｏｒａｃｌｅ性能工具以及成本计算着重分析了建立索引确实在系　统性能优化上起了重要作用。　关键词：甲骨文数据库；索引；性能分析；电子政务；情报管理　中图法分类号：ＴＰ３０９．３　文献标识号：Ａ　文章编号：１０００—７０２４（２０１２）０２—０５７０—０５　Ｉｎｔｅｌｌｉｇｅｎｃｅ　ｉｎｆｏｒｍａｔｉｏｎ　ｍａｎａｇｅｍｅｎｔ　ｓｙｓｔｅｍ　ｂａｓｅｄ　ｏｎ　ｉｎｄｅｘ　ｐｅｒｆｏｒｍａｎｃｅ　ａｎａｌｙｓｉｓ　ＺＥＮＧ　Ｃｈｕａｎ－ｊ　ｕｎ，ＦＵ　Ｘｉｕ－ｆｅｎ　（Ｃｏｌｌｅｇｅ　ｏｆ　Ｃｏｍｐｕｔｅｒ，Ｇｕａｎｇｄｏｎｇ　Ｕｎｉｖｅｒｓｉｔｙ　ｏｆ　Ｔｅｃｈｎｏｌｏｇｙ，Ｇｕａｎｇｚｈｏｕ　５１０００６，Ｃｈｉｎａ）　Ａｂｓｔｒａｃｔ：Ｄａｔａｂａｓｅ　ａｐｐｌｉｃａｔｉｏｎｓ　ｉｎ　ｔｈｅ　ｄｅｖｅｌｏｐｍｅｎｔ　ｏｆ　ｓｙｓｔｅｍ，ａ　ｐｒｏｂｌｅｍ　ｏｆ　ｏｎｅ　ＳＱＬ　ｓｔａｔｅｍｅｎｔ　ｏｆｔｅｎ　ｔｏｏｋ　ｔｈｅ　ｂｕｌｋ　ｏｆ　ｔｈｅ　ｒｅ—　ｓｏｕｒｃｅｓ，ｍａｋｉｎｇ　ｆｏｌｌｏｗ－ｕｐ　ｓｅｓｓｉｏｎ　ｃｏｕｌｄ　ｎｏｔ　ｐｅｒｆｏｒｍ　ｎｏｒｍａｌｌｙ　ａｎｄ　ｑｕｉｃｋｌ￣Ｓｏｍｅ　ｏｆ　ｔｈｅｓｅ　ｐｒｏｂｌｅｍｓ　ａｐｐｅａｒｅｄ　ｉｎ　ＳＱＬ　ｗｒｉｔｉｎｇ，　ｈａｄ　ｎｏｔ　ｃｏｎｓｉｄｅｒｅｄ　ｂｕｉｌｄｉｎｇ　ｉｎｄｅｘｅｓ　ｏｎ　ｔｈｅ　ｔａｂｌｅ，ａｎｄ　ｉｇｎｏｒｅｄ　ｔｈｅ　ｒｏｌｅ　ｏｆ　ｔｈｅ　ｉｎｄｅｘ　ｉｎ　ｔｅｒｍｓ　ｏｆ　ｐｅｒｆｏｒｍａｎｃｅ　ｗｈｉｃｈ　ｂｒｏｕｇｈｔ　ａｂｏｕｔ　ｌｏｗ　ｓｙｓｔｅｍ　ｐｅｒｆｏｒｍａｎｃｅ．Ａ　ｉｎｔｅｌｌｉｇｅｎｃｅ　ｉｎｆｏｒｍａｔｉｏｎ　ｍａｎａｇｅｍｅｎｔ　ｓｙｓｔｅｍ　ｉｓ　ｔａｋｅｎ　ａｓ　ｔｈｅ　ａｐｐｌｉｃａｔｉｏｎ　ｂａｃｋｇｒｏｕｎｄ，ｂｙ　ｕｓｉｎｇ　Ｏｒａｃｌｅ　ｐｅｒｆｏｒｍａｎｃｅ　ｔｏｏｌｓ　ａｎｄ　ｔｈｅ　ｃｏｓｔ　ａｎａｌｙｓｉｓ，ｔｈｅ　ｒｅｓｕｌｔ　ｐｒｏｖｅ　ｉｎｄｅｘ　ｉｎｄｅｅｄ　ｐｌａｙｓ　ａｎ　ｉｍｐｏｒｔａｎｔ　ｒｏｌｅ　ｉｎ　ｏｐｔｉｍｉｚｉｎｇ　ｔｈｅ　ｐｅｒｆｏｒｍａｎｃｅ．　Ｋｅｙ　ｗｏｒｄｓ：Ｏｒａｃｌｅ　ｄａｔａｂａｓｅ；ｉｎｄｅｘ；ｐｅｒｆｏｒｍａｎｃｅ　ａｎａｌｙｓｉｓ；ｅｌｅｃｔｒｏｎｉｃ　ｇｏｖｅｒｎｍｅｎｔ；ｉｎｆｏｒｍａｔｉｏｎ　ｍａｎａｇｅｍｅｎｔ　０引　言　在开发情报信息管理系统时，数据库的数据量非常大，　部分表数据上百万、千万条，给处理带来效率方面的难度。　尽管有Ｏｒａｃｌｅ这样强大的数据库作为后台支撑，效率问题　仍然是系统运行的瓶颈。对于只管将功能实现，而不关心　系统优化的开发过程已经严重影响后期的系统维护与使用。　很多公司企业将系统优化工作放到系统开发完成后，那是　一后期，调整的代价越大，相反，越早开始着手调整，收益　越大。因此开发出性能优越的系统，设计开发人员的前期　工作至关重要。　ｌ　系统业务与相关技术　１．１系统业务　情报信息管理是情报业务系统中的一个子系统，主要　处理已经采集好的情报、重大事件等。通过此子系统，工　种既耗时又费力的工作，如果资金不是很雄厚的公司企　作人员可以对当前提交信息或历史信息查询、分析、统计，　从这些数据中获得有价值的线索，对工作人员在处理事件，　业，更要考虑其在后期优化所承担的经济重担。传统的观　点认为调整优化是数据库管理人员的任务，其实良好的系　统环境在设计和开发期问，设计开发人员就应该设置性能　迅速做出决策、提高业务水平具有重要的意义。其业务如　图１所示。　１．２索引　期望值，并结合Ｏｒａｃｌｅ特性和优势以达到某个目标。良好　系统设计，可以在系统应用的生命周期中消除性能的代价　和挫折。具有多年经验的系统开发员知道：系统越到开发　Ｏｒａｃｌｅ提供了多种索引类型，但在情报信息管理系统　中常用的是Ｂ＊Ｔｒｅｅ索引。Ｂ＊Ｔｒｅｅ是传统的索引，是　收稿日期：２０１１－０２　０６；修订日期：２０１１　Ｏ４—１Ｏ　基金项目：广东省自然科学基金项目（０７００１８０２）　作者简介：曾传军（１９８５一），男，广东惠州人，硕士研究生，研究方向为计算机协同软件与数据库技术、网络安全；傅秀芬（１９５７一），　女，福建漳州人，硕士，教授，研究方向为网络多媒体软件、数据库技术、协同软件、网络安全等。Ｅ－ｍａｉｌ：ｃｈｕａ￣ｕｎｚｅｎｇ＠１６３．ｃｏｒｎ　第３３卷第２期　曾传军，傅秀芬：基于索引性能分析的情报信息管理系统研究　・５７１・　情报信息管理ｌ　重大事件管理ｌ　研判分析管理ｌ锋嚣　　＼　预案管理　Ｉ　零　舆情管理　Ｉ　系统业务　Ｈ　服务器”　用户　ｗｅｂ浏览器　问数据库　图１　系统业务访问　Ｏｒａｃｌｅ和大部分其它数据库中使用最多的索引。其结构与二　叉树相似，依据关键码提供对单行或多行的快速访问，通　常需要很少的读取就能找到正确的行。　在物理层上，Ｏｒａｃｌｅ读取的最小单位为数据库块（多　个连续的操作系统块组成），一次读取的最大值由操作系统　一次Ｉ／Ｏ的最大值与ｍｕｈｉｂｌｏｃｋ参数共同决定，所以即使　只需要一条记录，也会将该记录所在的数据库块一并读入　内存。逻辑上，Ｏｒａｃｌｅ用如下存取方法访问数据：全表扫　描、通过ｒｏｗｉｄ的表存取、索引扫描。索引扫描先通过ｉｎ—　ｄｅｘ查找数据对应的ｒｏｗｉｄ值，然后根据ｒｏｗｉｄ直接从表中　获得具体的数据，索引过程形如图２所示。索引的类型与　ｗｈｅｒｅ条件的不同，产生４种类型的索引扫描：索引唯　一扫描、索引范围扫描、索引全扫描、索引快速扫描。　图２索引扫描过程　１．３执行计划　执行一个ＳＱＬ语句，Ｏｒａｃｌｅ有可能要实现许多环节，　这些环节的每一步或从数据库中物理检索数据行，或用某　种方法准备数据行，供语句发出的用户使用。Ｏｒａｃｌｅ用来　执行语句的这些环节的组合称之为执行计划。执行计划是　ＳＱＬ优化中最为复杂、关键的部分，只有了解Ｏｒａｃｌｅ内部　如何执行该ＳＱＬ语句，才知道优化器选择的执行计划是　否最优。　１．４性能工具　为测试在情报信息管理系统中表加索引后，与之前没　加索引所产生的性能变化对比，使用了ａｕｔｏｔｒａｃｅ等性能工　具。这些工具可以查看ＳＱＬ的执行计划、资源的占用以及　方案对比。性能工具在分析ＳＱＬ活动起了很大作用，方便　开发人员判断语句优劣，从而调整优化。　２　性能分析　２．１执行计划分析　作为索引性能分析，选取了系统中数据量比较大的一　张线索事件信息表ｂ—ｑｂｇｌ—ｘｓｓＪｘｘ作为分析对象，系统当　前存在１００　１２３条记录。表中线索信息编号（ｘｓｘｘｂｈ）建有　索引。配置好ａｕｔｏｔｒａｃｅ工具，在应用程序ｓｑ１＊ｐｌｕｓ上执行　命令ｓｅｔ　ａｕｔｏｔｒａｃｅ　ｏｎ，就可以看到Ｏｒａｃｌｅ运行ＳＱＬ语句的　执行计划。对于此表，测试下面ＳＱＬ查询，得到执行计　戈０：ｓｅｌｅｃｔ　ｓｙｓｔｅｍｉｄ　ｆｒｏｍ　ｂ—ｑｂｇｌ—ＸＳＳＪ　ＸＸ　ｔ　ｗｈｅｒｅ　ｘｓｘｘｂｈ％　２００００００　ａｎｄ　ｄｅｐａｒｔｍｅｎｔｃｏｄｅ＝‘３７０１００００００００　；　当线索信息编号（ｘｓｘｘｂｈ）建有索引时的执行计划：　Ｅｘｅｃｕｔｉｏｎ　Ｐｌａｎ　Ｏ　ＳＥＬＥＣＴ　ｓＴＡＴＥＭＥＮＴ　Ｏｐｔｉｍｉｚｅｒ—ＡＬＬ～　ＲＯＷＳ（Ｃｏｓｔ＝３　Ｃａｒｄ＝１　Ｂｙｔｅｓ＝５０）　１　０　ＴＡＢＬＥ　ＡＣＣＥＳＳ（ＢＹ　ＩＮＤＥＸ　ＲＯＷＩＤ）ＯＦ　‘Ｂ—ＱＢＧＬ—ＸＳＳＪＸＸ’（ＴＡＢＬＥ）　（Ｃｏｓｔ＝３　Ｃａｒｄ一１　Ｂｙｔｅｓ＝５Ｏ）　２　１　ＩＮＤＥＸ（ＲＡＮＧＥ　ＳＣＡＮ）ＯＦ‘ＩＤＸＢ—～　ＱＢＧＬ—ＸＳＳＪＸＸ０１’（ＩＮＤＥＸ）（Ｃｏｓｔ＝２　Ｃａｒｄ＝１）　消除ｘｓｘｘｂｈ所建的索引后的执行计划：　Ｅｘｅｅｕｔｉｏｎ　Ｐｌａｎ　０　ＳＥＬＥＣＴ　ＳＴＡＴＥＭＥＮＴ　Ｏｐｔｉｍｉｚｅｒ：ＡＬＬ～　ＲＯＷＳ（Ｃｏｓｔ＝１５９０　ＣａＭ＝ｌ　Ｂｙｔｅｓ＝５０）　ｌ　０　ＴＡＢＬＥ　ＡＣＣＥＳＳ（ＦＵＬＬ）ＯＦ‘Ｂ～ＱＢＧＬ～　ＸＳＳＪＸＸ’（ＴＡＢＬＥ）（Ｃｏｓｔ＝１５９０　Ｃａｒｄ＝１　Ｂｙｔｅｓ＝５０）　从执行计划可以发现，使用了ＣＢＯ优化器执行ＳＱＬ　语句。字段没建索引，查询方式为全表扫描（ＦＵＬＬ），而　建索引，采用了索引范围扫描（ＲＡＮＧＥ　ＳＣＡＮ）。其中　Ｃｏｓｔ代表ＣＢＯ在这一步消耗的资源，ＣａＭ表示计划中这　一步所处理的行数，Ｂｙｔｅｓ指ＣＢＯ中这一步处理所有记录　的字节数，是估算出来的一组值。当为线索信息编号　（ｘｓｘｘｂｈ）建索引时，查询的花费（ｃｏｓｔ）只有３，而没建　索引的查询花费达到１５９０，且执行时间比约为１：７。资源　花费相比之下，它们在查询当中的效率有明显差别。　计算机工程与设计　２．２索引访问成本分析　２．２．２减少源表访问　２０１２年　在３．１节中，给出索引带来访问数据高性能的简单例　子。以下从索引访问数据时的成本计算中，剖析索引性能　调整问题的机理。成本公式为　Ｃｏｓｔ—ｂｌｅｖｅｌ＋ｃｅｉｌｉｎｇ（１ｅａｆｂｌｏｃｋｓ＊ｅｆｆｅｃｔｉｖｅ　ｉｎ—　—系统中线索事件信息表（ｂ—ｑｂｇｌ—ｘｓ￣ｘｘ）经常对某　个单位到当天数据量的进行统计查询。但其查询效率非常　低。所用的ＳＱＬ语句如下：　ｓｅｌｅｃｔ　ｃｏｕｎｔ（１）ｆｒｏｍ　ｂ—ｑｂｇｌｘｓｓｊＸＸ　ｗｈｅｒｅ　ｄｅｐａｒｔ—　ｄｅｘ　ｓｅｌｅｃｔｉｖｉｔｙ）＋ｃｅｉｌｉｎｇ（ｃｌｕｓｔｅｒｉｎｇ—ｆａｃｔｏｒ＊ｅｆｆｅｃｔｉｖｅ　ｔａ—　ｍｅｎｔｃｏｄｅ＝‘３７００００００００００’ａｎｄ　ｃｒｅａｔｅｄｔｉｍｅ￣ｓｙｓｄａｔｅ：　ｂｌｅ　ｓｅｌｅｃｔｉｖｉｔｙ）　在ｓｑｌ　ｐｌｕｓ上ｓｅｔ　ｔｉｍｉｎｇ　ｏｎ和打开ａｕｔｏｔｒａｃｅ后，虽然　公式中成本（Ｃｏｓｔ）包含３部分：　（１）根节点块（Ｒｏｏｔ　Ｂｌｏｃｋ）以及分枝节点块（Ｂｒａｎｃｈ　ｄｅｐａｒｔｍｅｎｔｃｏｄｅ，ｃｒｅａｔｅｄｔｉｍｅ单独建立索引，执行了４次，　发现执行也很快，平均也达到０．１２５３ｓ，令人满意。但这是　Ｂｌｏｃｋ）访问成本。ｂｌｅｖｅｌ表示索引Ｂ＊Ｔｒｅｅ树节点的层数，　也就是从根节点块访问到叶节点块时所经过的分枝节　点块数。　（２）索引的叶节点块访问成本。ｌｅａｆ—ｂｌｏｃｋｓ＊ｅｆｆｅｃ—　ｔｉｖｅ　ｉｎｄｅｘ　ｓｅｌｅｃｔｉｖｉｔｙ，ｌｅａｆ—ｂｌｏｃｋ表示索引叶节点块数，ｅｆ—　ｆｅｃｔｉｖｅ　ｉｎｄｅｘ　ｓｅｌｅｃｔｉｖｉｔｙ指的是ｓｑｌ的查询条件中的用于扫描　时的字段选择率。　（３）索引取ｍｗｉｄ，从ｒｏｗｉｄ访问表的成本。ｃｌｕｓｔｅｒｉｎｇ—　ｆａｃｔｏｒ表示聚集因子，反映了表数据的有序程度。ｅｆｆｅｃｔｉｖｅ　ｔａｂｌｅ　ｓｅｌｅｃｔｉｖｉｔｙ指查询条件中能够在索引上进行过滤字段的　所有字段的选择率。　遇到性能问题要用索引解决时，通常会考虑这３个部　分在成本上的消耗。例如，减少ｂｌｅｖｅｌ可以减少大量的逻　辑读，减小ｅｆｆｅｃｔｉｖｅ　ｔａｂｌｅ　ｓｅｌｅｃｔｉｖｉｔｙ，尽量使数据通过索引　访问，减少访问表次数。降低ｃｌｕｓｔｅｒｉｎｇ　ｆａｃｔｏｒ，可以减少　Ｉ／Ｏ操作的次数。　２．２．１降低聚集因子　因为索引中的数据是有序排列的，Ｏｒａｃｌｅ也是按照索　引的顺序访问数据，索引中ｒｏｗｉｄ指向的数据如果在同一　个数据块中，那么就可以减少逻辑１／Ｏ。而一般表索引中　列是固定顺序排列的（即聚集因子固定），不会因再建索引　而降低聚集因子，只有重建表，按照用户的需要排列数据　才能改变。　（１）运行３．１节的ＳＯＬ语句，已经知道建索引时，资　源花费很少。但从ｓｔａｔｉｓｔｉｃｓ的数据分析，其逻辑一致性读　（ｃｏｎｓｉｓｔｅｎｔ　ｇｅｔｓ）７３４４次，物理读（ｐｈｙｓｉｃａｌ　ｒｅａｄｓ）２２３　次。这个统计数据不那么另人满意的。　（２）重新按条件排列数据。　ｃｒｅａｔｅ　ｔａｂｌｅ　ｃｌｕｓｔｅｒｆａｃｔｏｒ—ｔｅｓｔ　ａｓ　ｓｅｌｅｃｔ＊ｆｒｏｍｂ—ｑｂｇｌ—　ｘｓｓｊｘｘ　ｔ　ｗｈｅｒｅ　ｘｓｘｘｂｈ＜２００００００　ａｎｄ　ｄｅｐａｒｔｍｅｎｔｃｏｄｅ一　‘３７Ｏ１ＯＯＯＯＯＯＯＯ’：　ｓｅｌｅｃｔ　ｓｙｓｔｅｍｉｄ　ｆｒｏｍ　ｃｌｕｓｔｅｒ　—ｆａｃｔｏｒ．—ｔｅｓｔ　ｗｈｅｒｅ　ｘｓｘｘｂｈ＜　２００００００　ａｎｄ　ｄｅｐａｒｔｍｅｎｔｃｏｄｅ￣‘３７０１００００００００’；　从执行计划ｓｔａｔｉｓｔｉｃｓ分析看到，逻辑一致性读只有１１　次，不到原来的１／７０ｏ，而物理读。次。由此看到抽取数据　按条件重新顺序排列，数据紧凑，聚集因子降低，性能明　显提升。　因为只有１Ｏ万左右的数据量才有这样的结果。如果数据量　达到了百万、千万条，在查询时会慢的多。就这张拥有１Ｏ　万条数据的表如果使用（ｓｅｌｅｃｔ＊）此类查询，输出时间平　均也在２分钟以上，运行非常慢。基于种种考虑，开发时　把两个字段（ｄｅｐａｒｔｍｅｎｔｃｏｄｅ，ｃｒｅａｔｅｄｔｉｍｅ）合起来建立一　个复合索引，意在减少源表的访问，再运行上面的ｓＱＩ　语　句。可以从表１看到两者建索引与复合索引的性能区　别，大约用了原来时间的１／４。而且表数据量越大，区别　越明显。　表１索引与复合索引比对　统计记录数Ｃｏｕ￣ｔ（１）一１０００５５。索引　（Ｏ．１２５３）／复合索引（Ｏ．０３１５）≈３．９８，可知１Ｏ万条数据　在建立复合索引后，时间上提高了３倍左右。可想在数据　量更大的处理中，这种索引应用会有多大的好处。复合索　引之所以能提高性能，最主要是减少了ｅｆｆｅｃｔｉｖｅ　ｔａｂｌｅ　ｓｅｌｅｃ—　ｔｉｖｉｔｙ基数，使得经ｒｏｗｉｄ访问表的数据量大大减少，进而　降低成本。在情报系统中，应用广泛。　２．３其它索引技术　索引调整性能还有很多的技术，需要根据不同的环境　背景，采取合适的索引。在情报信息管理系统中，应用了　多种索引技术解决性能问题。如为在大量情报中查询到符　合用户需要的情报正文，建立了ｉｎｔｅｒＭｅｄｉａ文本索引。系　统还使用了索引降序扫描、反向扫描等技术，限于篇幅，　在此不再赘述。读者可以从今后的系统开发体会它们在性　能提高的作用。　３实验与结果分析　３．１情报统计应用索引　在情报系统中经常要对情报进行统计，用户通过页面　显示的统计信息，可以及时了解当天，当月的动态，方便　研判分析工作。现存在统计汇总表ｂ—ｑｂｇｌ—ｔｊｘｘ，３张源　第３３卷第２期　曾传军，傅秀芬：基于索引性能分析的情报信息管理系统研究　・５７３・　表：分别是入库情报信息表ｂ—ｑｂｇｌ—ｊｓｑｋ，分发情报信息　表ｂ～ｑｂｇｌ—ｊｓｑｋ—ｃｌｘｘ，研判情报信息表ｂ—ｑｂｇｌ—ｙｐｔｑｈ。　从后３张表中，以不同的单位分组，统计出当天不同类别　的情报信息量。存储过程具体实现如下：　ｉｎｓｅｒｔ　ｉｎｔｏ　ｂ—ｑｂｇｌ—ｔｊｘｘ（ｓｙｓｔｅｍｉｄ，ｒｋｑｂ，ｆｆｑｂ，ｙｐｑｂ，　ｄｗｄｍ，ｔｊｒｑ）　ｓｅｌｅｃｔ　ｇｅｔｉｄ（ｎｕｌ１），ｓｕｍ（ｑｂｓ），ｓｕｍ（ｆｆｓ），ｓｕｍ　（ｙｐｓ），ｄｗｄｍ，ｖ—ｄａｔｅ　ｆｒｏｍ　（　（ｓｅｌｅｃｔ　ｃｏｕｎｔ（１）ｑｂｓ，０　ａｓ　ｆｆｓ，０　ａｓ　ｙｐｓ，ｊｓｄｗ　ａｓ　ｄｗｄｍ　ｆｒｏｍ　ｂ—ｑｂｇｌ—ｊｓｑｋ　ｗｈｅｒｅ　ｃｒｅａｔｅｄｔｉｍｅ￣．．ａｎｄ　ｅｒｅａｔ—　ｅｄｔｉｍｅ￣．．ｇｒｏｕｐ　ｂｙ　ｊｓｄｗ）ｕｎｉｏｎ　ａｌｌ　（ｓｅｌｅｃｔ　０　ｑｂｓ，ｃｏｕｎｔ（１）ｆｆｓ，０　ａｓ　ｙｐｓ，ｆｓｄｗ　ａｓ　ｄｗｄｍ　ｆｒｏｍ　ｂ—ｑｂｇｌ—ｊｓｑｋ—ｃｌｘｘ　ｗｈｅｒｅ　ｆｓｓｊ＞．．ａｎｄ　ｆｓｓｊ＜．．ｇｒｏｕｐ　ｂｙ　ｆｓｄｗ）　ｕｎｉｏｎ　ａｌｌ　（ｓｅｌｅｃｔ　０　ｑｂｓ，０　ａｓ　ｆｆｓ，ｃｏｕｎｔ（１）ｙｐｓ，ｙｐｄｗ　ａｓ　ｄｗｄｍ　ｆｒｏｍ　ｈ—ｑｂｇｌ—ｙｐｔｑｂ　ｗｈｅｒｅ　ｙｐｒｑ＞．．ａｎｄ　ｙｐｒｑ＜．．ａｎｄ　ｓｆｙｐ一‘１’ｇｒｏｕｐ　ｂｙ　ｙｐｄｗ）　）　ｇｒｏｕｐ　ｂｙ　ｄｗｄｍ；　实验是对３Ｏ万，９Ｏ万，１５０万条数据量，分别在ｃｒｅａ—　ｔ￣ｉｍｅ，ｆｓｓｊ，ｙｐｒｑ这３个字段上建有索引与否时，测试出所　使用的花费与运行时间。排除其它情况，只考虑３个索引同　时存在和同时不存在的情况。抽取上面查询语句运行得到执　行计划，在ｓｑｌ＊ｐｌｕｓ上运行的结果如图３，图４所示。　０．４８　Ｏ．Ｏ９　．嘲　Ｏ－２６　．嘲　１　２　３　数据量　髓有索引　一无索引　图３时间消耗对比　稚｛　牲　数据量　＋有索引　＋无索引　图４执行计划中的花费代价（ｃｏｓｔ）曲线　两个图的Ｘ轴上的数据量：１表示３Ｏ万条、２表示９Ｏ　万条、３表示１５０万条表记录。　３．２结果分析　３　２　ｌ　０　上面结果是在一种理想状态下所给出的测试结果，数　５　３　５　２　５　１　５　Ｏ　据量增大，而ＳＱＬ语句控制查询出符合条件的量一定，都　是５４９９７条。由图３所示，建有索引的不同数据量上运行时　间分别是０．０９ｓ、０．２６ｓ、０．４８ｓ，无建索引时对应的是２．３９ｓ、　２．７５ｓ、３．３Ｊｓ。对比之下，可见建索引对语句执行效率的重　大影响。图４也能体现建索引的好处，使执行语句的资源花　费降低到一定的程度。另外可以看到，随着数据量的增加，　查询所花费的时间，资源也相应的增加，但这也是在理想的　状态下所呈现的趋势，并不是任何环境下都会出现相似的结　果，需考虑多方面的影响。如所查询的数据块已经存在于内　存，语句执行时间与Ｉ／ｏ操作必然会相应的减少，相反在内　存中并没有驻留语句所需要的数据块，其结果是从数据库中　寻找，再映射到内存，这样必然增加数据的Ｉ／Ｏ操作，延　长执行的时间。因此，即使数据量再少，也有可能比数据　量大的所花费时间长。在测试的多数情况下，都能发现这　样的奇怪现象，其实这是数据库在后台结合多种技术的隐　性处理，对语句的高效处理起了重要作用。　４结束语　情报系统是一个结构复杂、业务繁多、安全性和保密　性要求高的电子政务系统。由于数据量庞大，系统数据处　理压力相对也大，因此在系统的分析设计阶段就需考虑性　能问题，以提供用户高效的交互效率。通过对索引在系统　开发中的性能分析，调整ＳＱＬ语句的编写，为情报管理系　统获得高效的运行速度提供了技术依据。在使用索引相关　技术调整后，系统运行更加流顺通畅，用户通过Ｗｅｂ浏览　或后台数据访问获得了满意的效果。系统开发是一个复杂　过程，在以后的开发中需要根据不同的情况分析，合理应　用不同的索引技术，以达到更好的性能效果。　参考文献：　［１］Ｃｏｎｎｅｒ　ＭｃＤｏｎａｌｄ，Ｃｈａｉｍ　Ｋａｔｚ，Ｃｈｒｉｓｔｏｐｈｅｒ　Ｂｅｃｋ．Ｍａｓｔｅｒｉｎｇ　ｏｒａｃｌｅ　ＰＬ／ＳＱＬ　ｐｒａｃｔｉｃａｌ　ｓｏｌｕｔｉｏｎｓ　ＥＭ］．蔡伟毅，译．北京：　人民邮电出版社，２００９．　Ｅ２］Ｔｈｏｍａｓ　Ｋｙｔｅ．Ｅｘｐｅｒｔ　Ｏｒａｃｌｅ　ｄａｔａｂａｓｅ　ａｒｃｈｉｔｅｃｔｕｒｅ　９ｉ　ａｎｄ　ｌＯｇ　ｐｒｏｇｒａｍｍｉｎｇ　ｔｅｃｈｎｉｑｕｅｓ　ａｎｄ　ｓｏｌｕｔｉｏｎｓ［Ｍ］．ＵＳＡ：Ａｐｒｅｓｓ　Ｅｘｐｅｒｔ，２００５．　［３］Ｈｅｃｔｏｒ　Ｇａｒｃｉａ－Ｍｄｉｎａ，Ｊｅｆｆｒｅｙ　Ｄ　Ｕｌｌｍａｎ，Ｊｅｎｎｉｆｅｒ　Ｗｉｄｏｍ．　Ｄａｔａｂａｓｅ　ｓｙｓｔｅｍ　ｉｍｐｌｅｍｅｎｔａｔｉｏｎ　ＥＭ］．杨冬青，吴愈青，包小　源，等译．北京：机械工业出版社，２０１０．　［４］ＷＡＮＧ　Ｄｏｎｇ，ＺＨＥＮＧ　Ｚｈ￣ｈｏｎｇ．Ｒｅｓｅｒａｃｈ　ａｎｄ　ｄｅｓｉｇｎ　ｏｆ　Ｅｃｏｍｒｎｅｒｃｅ　ｃｏｍｐｏｎｅｎｔ［Ｊ］．Ｃｏｍｐｕｔｅｒ　Ｅｎｇｉｎｅｅｒｉｎｇ　ａｎｄ　Ｄｅ－　ｓｉｇｎ，２０１０，３１（２）：３７４—３７７（ｉｎ　Ｃｈｉｎｅｓｅ）．［王东，张志鸿．　电子商务领域构建的研究与设计［Ｊ］．计算机工程与设计，　・　５７４・　计算机工程与设计　２０１２年　２０１０，３１（２）：３７４—３７７．　Ｅｓ］儿ＡＮＧ　Ｙｉ，ＪＩＡＮＧ　Ｘｉｎ，ＦＡＮＧ　Ｍｉａｏ．Ｔｅｘｔ　ｔｒａｎｓｌａｔｉｏｎ　ｉｎｄｅｘ　ｂａｓｅｄ　ｏｎ　ｉｎｔｅｒｔｅｘｔｕａｌｉｔｙ　ｃａｌｃｕｌａｔｉｏｎ口］．Ｃｏｍｐｕｔｅｒ　Ｅｎｇｉｎｅｅｒｉｎｇ　ａｎｄ　Ｄｅｓｉｇｎ，２０１０，３１（１５）：３４９０—３４９１（ｉｎ　Ｃｈｉｎｅｓｅ）．　［姜　怡，姜欣，方淼．基于互文性度量的文本翻译索引［Ｊ］．计算　机工程与设计，２０１０，３１（１５）：３４９０—３４９１．］　［６］ＬＥＩ　Ｃｈｕｎ－ｈｏｎｇ，ＹＵ　Ｊｉａｎ－ｑｉａｏ．Ｂ＋ｔｒｅｅ　ｉｎｄｅｘ　ｆｏｒ　ｅｎｃｒｙｐｔｅｄ　ｄａｔａ—　ｂａｓｅ　ｂａｓｅｄ　ｏｎ　ｍｏｄｉｆｉｅｄ　ｂｉｎｓｅａｒｃｈ　ＥＪ］．Ｃｏｍｐｕｔｅｒ　Ｅｎｇｉｎｅｅｒｉｎｇ　ａｎｄ　Ｄｅｓｉｇｎ，２０１０，３１（４）：７１３—７１６（ｉｎ　Ｃｈｉｎｅｓｅ）．［雷春红，余建　桥．基于密文块数组折半查找的Ｂ＋树密文数据库索引ｌ＝Ｊ］．计　算机工程与设计，２０１０，３１（４）：７１３　７１６．］　［７］ＣＨＥＮ　Ｈｕｉ—ｐｉｎｇ，ＹＵ　Ｇｕｏ－ｚｈｅｎｇ，ＷＡＮＧ　Ｊｉａｎ－ｄｏｎｇ．Ｓｔｕｄｙ　ｏｎ　ａｐｐｌｉｃａｔｉｏｎ　ｏｆ　ｆｕｌｌ—－ｔｅｘｔ　ｉｎｄｅｘｉｎｇ　ｔｅｃｈｎｏｌｏｇｙ　ｉｎ　ｏｆｆｉｃｅ　ａｕｔｏｍａ——　ｔｉｏｎ　ｓｙｓｔｅｍ［Ｊ］．Ａｐｐｌｉｃａｔｉｏｎ　Ｒｅｓｅａｒｃｈ　ｏｆ　Ｃｏｍｐｕｔｅｒｓ，２００７，　２４（２）：２２２—２２４（ｉｎ　Ｃｈｉｎｅｓｅ）．　［陈慧萍，于国政，王建东．　全文索引技术在办公自动化系统中的应用研究＿Ｊ］．计算机应　用研究，２００７，２４（２）：２２２—２２４．］　［８］ＰＡＮ　Ｉｍｎｇ－ｘｉ，ＳＵＮ　Ｌｅ．Ｉｎｄｅｘ　ｔｅｃｈｎｉｑｕｅ　ｆｏｒ　ｄｙｎａｍｉｃ　ｃｏｒｐｕｓ　［ｊ］．Ａｐｐｌｉｃａｔｉｏｎ　Ｒｅｓｅａｒｃｈ　ｏｆ　Ｃｏｍｐｕｔｅｒｓ，２００９，２６（１）：１１—　１４（ｉｎ　Ｃｈｉｎｅｓｅ）．［潘隆禧，孙乐．基于动态文档集的索引技　术［Ｊ］．计算机应用研究，２００９，２６（１）：１１—１４．］　Ｅ９］ＸＩＡＯ　Ｈｕｉ，ＬＩ　Ｑｉｎｇ－ｑｕａｎ．Ａｃｃｅｓｓ　ｍｅｔｈｏｄｓ　ｉｎ　ｍｏｖｉｎｇ　ｏｂｊｅｃｔｓ　ｄａｔａ—　ｂａｓｅｓ［Ｊ］．Ｊｏｕｒｎａｌ　ｏｆ　Ｃｏｍｐｕｔｅｒ　Ａｐｐｌｉｃａｔｉｏｎｓ，２０１０，３０（４）：　１０６４—１０６７（ｉｎ　Ｃｈｉｎｅｓｅ）．［肖辉，李清泉．移动对象数据库索引　研究综述ＥＪ］．计算机应用，２０１０，３０（４）：１０６４—１０６７．］　［１ｏ］ＹＵ　Ｙａｎ，ＬＩＮＷｅｉ—ｈｕａ，ＴＡＮ　Ｘｉａｏ—ｊｕｎ．Ｓｐａｔｉａｌ　ｉｎｄｅｘｍｅｔｈｏｄ　ｂａｓｅｄ　ｏｎ　Ｒ　ｔｒｅｅ＿＿Ｊ］．Ｃｏｍｐｕｔｅｒ　Ｅｎｇｉｎｅｅｒｉｎｇ，２０１０，３６（１２）：　３１—３３（ｉｎ　Ｃｈｉｎｅｓｅ）．［余艳，林伟华，谈晓军．一种基于Ｒ－ｔｒｅｅ　的空间索引方法ＥＪ］．计算机工程，２０１０，３６（１２）：３１—３３．］　［１１］ＬＩ　Ｙｕｎ－ｐｅｎｇ，ＸＩＯＮＧ　Ｏｕｉ—ｘｉ．Ｔｒａｆｆｉｃ　ｍａｎａｇｅｍｅｎｔ　ｄｏｍａｉｎ－ｏｒｉｅｎ—　ｔｅｄ　ｃｌａｓｓｉｆｉｄｅ　ｉｎｄｅｘ　ａｌｇｏｒｉｔｈ［Ｊ］．Ｃｏｍｐｕｔｅｒ　Ｅｎｇｉｎｅｅｒｉｎｇ，２００９，　３５（２Ｏ）：２７６　２８０（ｉｎ　Ｃｈｉｎｅｓｅ）．［李云鹏，熊桂喜．面向交通　管理领域的分类索引算法ＥＪ］．计算机工程，２００９，３５（２０）：　２７６　２８０．］　［１２］ＷＡＮＧ　Ｂｉｎ，ＺＨＡＮＧ　Ｊｉ－ｌｏｎｇ，ＸＵ　Ｙｉｎｇ　ｘｉａｏ．Ｎｅｗ　ｍｅｔｈｏｄ　ｏｆ　ｉｎｔｅｇｒａｔｉｎｇ　ｄａｔａ　ｐｅｒｓｉｓｔｅｎｃｅ　ａｎｄ　ｆｕｌｌ　ｔｅｘｔ　ｉｎｄｅｘ［Ｊ］．Ｃｏｍ—　ｐｕｔｅｒ　Ｅｎｇｉｎｅｅｒｉｎｇ，２００９，３５（３）：４２—４４（ｉｎ　Ｃｈｉｎｅｓｅ）．［王　彬，张计龙，徐迎晓．整合数据持久化与全文检索的新方法　ＥＪ］．计算机工程，２００９，３５（３）：４２—４４．］　［１３］ＤＥＮＧ　Ｐａｎ，ＬＩＵ　Ｇｏｎｇ—ｓｈｅｎ．Ｅｆｆｅｃｔｉｖｅ　ｓｔｏｒａｇｅ　ｓｔｒｕｃｔｕｒｅ　ｏｆ　ｉｎｖｅｒｔｅｄ　ｉｎｄｅｘ［Ｊ］．Ｃｏｍｐｕｔｅｒ　Ｅｎｇｉｎｅｅｒ　ａｎｄ　Ａｐｐｌｉｃａｔｉｏｎｓ，　２００８，４４（３１）：１４９—１５２（ｉｎ　Ｃｈｉｎｅｓｅ）．［邓攀，刘功申．一　种高效的倒排索引存储结构＿ｊ］．计算机工程与应用，２００８，　４４（３１）：１４９—１５２．］　［１４］Ｈｙｕｎｈｏ　Ｌｅｅ，Ｗｏｎｓｕｋ　Ｌｅｅ．Ｑｕｅｒｙ　ｏｐｔｉｍｉｚａｔｉｏｎ　ｆｏｒ　ｗｅｂ　ＢＢＳ　ｂｙ　ａｎａｌｙｔｉｃｆｕｎｃｔｉｏｎ　ａｎｄ　ｆｕｎｃｔｉｏｎ　ｂａｓｅｄ　ｉｎｄｅｘ　ｉｎ　Ｏｒａｃｌｅ　ＤＢＭＳ［ｃ］．　Ｌｕｏｙａｎｇ，Ｈｅｎａｎ，Ｃｈｉｎａ：Ａｄｖａｎｃｅｄ　Ｌａｎｇｕａｇｅ　Ｐｒｏｃｅｓｓｉｎｇ　ａｎｄ　Ｗｅｂ　Ｉｎｆｏｒｍａｔｉｏｎ　Ｔｅｃｈｎｏｌｏｇｙ，２００７：６０６—６１１．　［１５］Ｃｈｒｉｓｔｉａｎ　Ａｎｔｏｇｎｉｎｉ．　Ｔｒｏｕｂｌｅｓｈｏｏｔｉｎｇ　Ｏｒａｃｌｅ　ｐｅｒｆｏｒｍａｎｃｅ　［Ｍ］．童家旺，胡怡，冯大辉，译．北京：人民邮电出版　社，２００９．　

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文