性能測試是通過自動化的測試工具模擬多種正常、峰值以及異常負載條件來對系統(tǒng)的各項性能指標進行測試。負載測試和壓力測試都屬于性能測試,兩者可以結(jié)合進行。通過負載測試,確定在各種工作負載下系統(tǒng)的性能,目標是測試當負載逐漸增加時,系統(tǒng)各項性能指標的變化情況。壓力測試是通過確定一個系統(tǒng)的瓶頸或者不能接收的性能點,來獲得系統(tǒng)能提供的大服務級別的測試。
 
  一、概述性能測試在軟件的質(zhì)量保證中起著重要的作用,它包括的測試內(nèi)容豐富多樣。中國軟件評測中心將性能測試概括為三個方面:應用在客戶端性能的測試、應用在網(wǎng)絡上性能的測試和應用在服務器端性能的測試。通常情況下,三方面有效、合理的結(jié)合,可以達到對系統(tǒng)性能全面的分析和瓶頸的預測。
 
  二、應用在客戶端性能的測試應用在客戶端性能測試的目的是考察客戶端應用的性能,測試的入口是客戶端。它主要包括并發(fā)性能測試、疲勞強度測試、大數(shù)據(jù)量測試和速度測試等,其中并發(fā)性能測試是重點。
 
  并發(fā)性能測試是重點并發(fā)性能測試的過程是一個負載測試和壓力測試的過程,即逐漸增加負載,直到系統(tǒng)的瓶頸或者不能接收的性能點,通過綜合分析交易執(zhí)行指標和資源監(jiān)控指標來確定系統(tǒng)并發(fā)性能的過程。負載測試(Load Testing)是確定在各種工作負載下系統(tǒng)的性能,目標是測試當負載逐漸增加時,系統(tǒng)組成部分的相應輸出項,例如通過量、響應時間、CPU負載、內(nèi)存使用等來決定系統(tǒng)的性能。負載測試是一個分析軟件應用程序和支撐架構(gòu)、模擬真實環(huán)境的使用,從而來確定能夠接收的性能過程。壓力測試(Stress Testing)是通過確定一個系統(tǒng)的瓶頸或者不能接收的性能點,來獲得系統(tǒng)能提供的大服務級別的測試。
 
  并發(fā)性能測試的目的主要體現(xiàn)在三個方面:以真實的業(yè)務為依據(jù),選擇有代表性的、關(guān)鍵的業(yè)務操作設計測試案例,以評價系統(tǒng)的當前性能;當擴展應用程序的功能或者新的應用程序?qū)⒁徊渴饡r,負載測試會幫助確定系統(tǒng)是否還能夠處理期望的用戶負載,以預測系統(tǒng)的未來性能;通過模擬成百上千個用戶,重復執(zhí)行和運行測試,可以確認性能瓶頸并優(yōu)化和調(diào)整應用,目的在于尋找到瓶頸問題。
 
  當一家企業(yè)自己組織力量或委托軟件公司代為開發(fā)一套應用系統(tǒng)的時候,尤其是以后在生產(chǎn)環(huán)境中實際使用起來,用戶往往會產(chǎn)生疑問,這套系統(tǒng)能不能承受大量的并發(fā)用戶同時訪問?這類問題常見于采用聯(lián)機事務處理(OLTP)方式數(shù)據(jù)庫應用、Web瀏覽和視頻點播等系統(tǒng)。這種問題的解決要借助于科學的軟件測試手段和先進的測試工具。
 
  舉例說明:電信計費軟件眾所周知,每月20日左右是市話交費的高峰期,全市幾千個收費網(wǎng)點同時啟動。收費過程一般分為兩步,首先要根據(jù)用戶提出的電話號碼來查詢出其當月產(chǎn)生費用,然后收取現(xiàn)金并將此用戶修改為已交費狀態(tài)。一個用戶看起來簡單的兩個步驟,但當成百上千的終端,同時執(zhí)行這樣的操作時,情況大不一樣了,如此眾多的交易同時發(fā)生,對應用程序本身、操作系統(tǒng)、中心數(shù)據(jù)庫服務器、中間件服務器、網(wǎng)絡設備的承受力都是一個嚴峻的考驗。決策者不可能在發(fā)生問題后才考慮系統(tǒng)的承受力,預見軟件的并發(fā)承受力,這是在軟件測試階段應該解決的問題。
 
  目前,大多數(shù)公司企業(yè)需要支持成百上千名用戶,各類應用環(huán)境以及由不同供應商提供的元件組裝起來的復雜產(chǎn)品,難以預知的用戶負載和愈來愈復雜的應用程序,使公司擔憂會發(fā)生投放性能差、用戶遭受反應慢、系統(tǒng)失靈等問題。其結(jié)果是導致公司收益的損失。
 
  如何模擬實際情況呢?找若干臺電腦和同樣數(shù)目的操作人員在同一時刻進行操作,然后拿秒表記錄下反應時間?這樣的手工作坊式的測試方法不切實際,且無法捕捉程序內(nèi)部變化情況,這樣需要壓力測試工具的輔助。
 
  測試的基本策略是自動負載測試,通過在一臺或幾臺PC機上模擬成百或上千的虛擬用戶同時執(zhí)行業(yè)務的情景,對應用程序進行測試,同時記錄下每一事務處理的時間、中間件服務器峰值數(shù)據(jù)、數(shù)據(jù)庫狀態(tài)等。通過可重復的、真實的測試能夠徹底地度量應用的可擴展性和性能,確定問題所在以及優(yōu)化系統(tǒng)性能。預先知道了系統(tǒng)的承受力,為終用戶規(guī)劃整個運行環(huán)境的配置提供了有力的依據(jù)。
 
  并發(fā)性能測試前的準備工作測試環(huán)境:配置測試環(huán)境是測試實施的一個重要階段,測試環(huán)境的適合與否會嚴重影響測試結(jié)果的真實性和正確性。測試環(huán)境包括硬件環(huán)境和軟件環(huán)境,硬件環(huán)境指測試必需的服務器、客戶端、網(wǎng)絡連接設備以及打印機/掃描儀等輔助硬件設備所構(gòu)成的環(huán)境;軟件環(huán)境指被測軟件運行時的操作系統(tǒng)、數(shù)據(jù)庫及其他應用軟件構(gòu)成的環(huán)境。
 
  一個充分準備好的測試環(huán)境有三個優(yōu)點:一個穩(wěn)定、可重復的測試環(huán)境,能夠保證測試結(jié)果的正確;保證達到測試執(zhí)行的技術(shù)需求;保證得到正確的、可重復的以及易理解的測試結(jié)果。
 
  測試工具:并發(fā)性能測試是在客戶端執(zhí)行的黑盒測試,一般不采用手工方式,而是利用工具采用自動化方式進行。目前,成熟的并發(fā)性能測試工具有很多,選擇的依據(jù)主要是測試需求和性能價格比。的并發(fā)性能測試工具有QALoad、LoadRunner、Benchmark Factory和Webstress等。這些測試工具都是自動化負載測試工具,通過可重復的、真實的測試,能夠徹底地度量應用的可擴展性和性能,可以在整個開發(fā)生命周期、跨越多種平臺、自動執(zhí)行測試任務,可以模擬成百上千的用戶并發(fā)執(zhí)行關(guān)鍵業(yè)務而完成對應用程序的測試。
 
  測試數(shù)據(jù):在初始的測試環(huán)境中需要輸入一些適當?shù)臏y試數(shù)據(jù),目的是識別數(shù)據(jù)狀態(tài)并且驗證用于測試的測試案例,在正式的測試開始以前對測試案例進行調(diào)試,將正式測試開始時的錯誤降到低。在測試進行到關(guān)鍵過程環(huán)節(jié)時,非常有必要進行數(shù)據(jù)狀態(tài)的備份。制造初始數(shù)據(jù)意味著將合適的數(shù)據(jù)存儲下來,需要的時候恢復它,初始數(shù)據(jù)提供了一個基線用來評估測試執(zhí)行的結(jié)果。
 
  在測試正式執(zhí)行時,還需要準備業(yè)務測試數(shù)據(jù),比如測試并發(fā)查詢業(yè)務,那么要求對應的數(shù)據(jù)庫和表中有相當?shù)臄?shù)據(jù)量以及數(shù)據(jù)的種類應能覆蓋全部業(yè)務。
 
  模擬真實環(huán)境測試,有些軟件,特別是面向大眾的商品化軟件,在測試時常常需要考察在真實環(huán)境中的表現(xiàn)。如測試殺毒軟件的掃描速度時,硬盤上布置的不同類型文件的比例要盡量接近真實環(huán)境,這樣測試出來的數(shù)據(jù)才有實際意義。
 
  并發(fā)性能測試的種類與指標并發(fā)性能測試的種類取決于并發(fā)性能測試工具監(jiān)控的對象,以QALoad自動化負載測試工具為例。軟件針對各種測試目標提供了DB2、DCOM、ODBC、ORACLE、NETLoad、Corba、QARun、SAP、SQLServer、Sybase、Telnet、TUXEDO、UNIFACE、WinSock、WWW、Java Script等不同的監(jiān)控對象,支持Windows和UNIX測試環(huán)境。
 
  關(guān)鍵的仍然是測試過程中對監(jiān)控對象的靈活應用,例如目前三層結(jié)構(gòu)的運行模式廣泛使用,對中間件的并發(fā)性能測試作為問題被提到議事日程上來,許多系統(tǒng)都采用了國產(chǎn)中間件,選擇Java Script監(jiān)控對象,手工編寫腳本,可以達到測試目的。
 
  采用自動化負載測試工具執(zhí)行的并發(fā)性能測試,基本遵循的測試過程有:測試需求與測試內(nèi)容,測試案例制定,測試環(huán)境準備,測試腳本錄制、編寫與調(diào)試,腳本分配、回放配置與加載策略,測試執(zhí)行跟蹤,結(jié)果分析與定位問題所在,測試報告與測試評估。
 
  并發(fā)性能測試監(jiān)控的對象不同,測試的主要指標也不相同,主要的測試指標包括交易處理性能指標和UNIX資源監(jiān)控。其中,交易處理性能指標包括交易結(jié)果、每分鐘交易數(shù)、交易響應時間(Min:小服務器響應時間;Mean:平均服務器響應時間;Max:大服務器響應時間;StdDev:事務處理服務器響應的偏差,值越大,偏差越大;Median:中值響應時間;90%:90%事務處理的服務器響應時間)、虛擬并發(fā)用戶數(shù)。
 
  應用實例:“新華社多媒體數(shù)據(jù)庫V1.0”性能測試中國軟件評測中心(CSTC)根據(jù)新華社技術(shù)局提出的《多媒體數(shù)據(jù)庫(一期)性能測試需求》和GB/T 17544《軟件包質(zhì)量要求和測試》的標準,使用工業(yè)標準級負載測試工具對新華社使用的“新華社多媒體數(shù)據(jù)庫V1.0”進行了性能測試。
 
  性能測試的目的是模擬多用戶并發(fā)訪問新華社多媒體數(shù)據(jù)庫,