1樓:
哇,就這麼點分,想讓我幫你做專案啊?
2樓:匿名使用者
我也不會⊙ω⊙哈哈哈哈哈也是查答案的一員
速求資料庫實踐報告和配套資料庫 20
3樓:匿名使用者
電子資訊工程畢業實踐報告
實踐」是件聽起來輕鬆,實則卻「蘊味」十足,甚至意義深刻的事。實踐能使你已成的「慣性」和被特定環境「保護」的生活重新增添一些色彩,確切地說,這是一個「過程」,過程中夾雜著忙與快樂。
「萬事開頭難」這話一點兒也不假,雖然我參與實踐的時間不長,但求職之路的艱辛和求到職之後的茫然讓我感嘆市場競爭的激烈,在超市工作的生活實踐讓我感悟到了生活的艱辛。就目前的超市資料庫的管理,我想談談其關聯規則。目前,在需要處理大資料量的科研領域中,資料探勘受到越來越多的關注。
我們可以利用資料探勘技術從海量資料中發現有用資訊,幫助商家瞭解客戶以往的需求趨勢,並**未來,從而給商家帶來巨大的利潤。在資料探勘領域,採用關聯規則在大型事務資料庫中進行資料探勘是一個重要的研究內容。關聯規則是美國ibm almaden research center的rabesh agrawal等人於2023年首先提出的kdd研究中的一個重要課題。
關聯規則挖掘的一般物件是事務資料庫,這種資料庫的主要應用在零售業,比如超級市場的銷售管理。關聯規則就是發現事務資料庫中不同商品(項)(item,指事務中的內容,比如,麵包、牛奶等都是專案)之間是否存在某種關聯關係。通過這些規則找出顧客購買行為模式,如購買了某一商品對購買其他商品的影響。
發現這樣的規則可以應用於商品貨架設計、貨存安排以及根據購買模式對使用者進行分類。
2關聯規則描述
目前關聯規則挖掘主要考慮支援度和置信度兩個閾值。設x是項集,t是資料庫db中的任意一個記錄。x的支援度是指支援x的記錄數與全體記錄數的比,support(x)=||/|db|。
蘊涵關係x==>y在資料庫db中的置信度是指同時支援x和y的記錄數與支援x的記錄數之比,即:confidence(x==>y)=||/|| 支援度可理解為在db中隨機抽取一個記錄,該記錄同時支援x和y的概率。置信度可理解為在支援x的記錄全體中隨機取一個記錄,該記錄支援y的概率。
3發現關聯規則的操作步驟
目前,由於條碼技術的發展,顧客在超市中購買商品的資訊可以很方便的被存放在資料庫中,針對資料庫中大量的資料,我們如何發現它們之間存在的關聯是本文主要討論的問題。關聯規則的挖掘問題就是在超市事務資料庫db中找出具有使用者給定的最小支援度和最小置信度的關聯規則。關聯規則的挖掘對市場調節和爭取顧客方面的應用是極有價值的。
因此,有必要採用快速演算法從超市事務資料庫中挖掘關聯規則。由超市事務資料庫發現關聯規則挖掘可以分以下兩步完成:
1)找出超市事務資料庫db中所有大於等於使用者指定最小支援度的專案集,具有最小支援度的專案集稱為頻繁項集。
2)利用頻繁項集生成所期望的關聯規則,即這些規則必須滿足最小支援度min_supp和最小置信度min_conf。
事實上,第一步的任務是迅速高效地找出超市事務資料庫db中全部頻繁項集,資料探勘所面臨的最大的挑戰是計算效率問題,解決這一問題的途徑是產生高效的資料探勘演算法,但從超市事務資料庫中產生頻繁項集即費時又佔用空間,所以說第一步是關聯規則挖掘的核心問題,是衡量關聯規則挖掘演算法的標準。當找到所有的頻繁項集後,相應的關聯規則將很容易生成,目前大多數的關聯規則挖掘演算法研究是針對第一步而提出的,本文重點討論第一個問題。
4由超市事務資料庫發現關聯規則的總體設計
在現有的不少關聯規則發現演算法中,最著名的仍然是r.agrawal本人在他們自己的ais演算法基礎上於2023年提出的apriori演算法,apriori演算法的基本思想是:利用「頻繁項集的所有非空子集都必須也是頻繁的」這一定理對事務資料庫進行多遍掃描。
眾所周知,對資料庫的掃描伴隨繁重的磁碟i/o任務,apriori演算法中,掃描次數較多,這樣就大大限制了挖掘演算法的速度。因此,在實際的應用中,減少對事務資料庫的掃描次數,有效地減少資料的吞吐,將會有效提高演算法的效率。為了高效率的由超市事務資料庫中發現關聯規則,本系統在apriori演算法的基礎上採用基於劃分的演算法。
該演算法只對事務資料庫db掃描兩次,大大減少了i/o操作,從而提高了演算法的效率。
通過劃分方法進行資料探勘的過程如下圖所示:
本系統的總體設計包含三部分:
(1) 在伺服器端第一次掃描超市事務資料庫中的表,按照超市事務資料庫中不同項集的數量,以及兼顧客戶端計算機硬體配置,對其進行資料分塊,分塊的大小選擇要使得每個分塊可以被放入主存。
(2) 在各個客戶端計算機上,利用並行技術分別訪問伺服器上的資料分塊,求出各資料分塊所對應的區域性頻繁項集,並將所求區域性頻繁項集存入伺服器的一個指定表中。
(3) 在伺服器端,彙總各個分塊資料生成的區域性頻繁項集,第二次掃描超市事務資料庫中的總表,最終生成全域性頻繁項集。
系統的總體設計可以如下圖2 應用程式總體設計所示。
一旦由超市事務資料庫db中的事務找出頻繁項集,由它們產生強關聯規則是直截了當的。所謂的強關聯規則是指滿足最小支援度和最小置信度的規則。
5結論隨著計算機硬體的降價,利用並行處理的思想,劃分的資料塊分給多個處理機平行計算各資料塊的區域性頻繁項集,然後各分塊所求的區域性頻繁項集彙總到伺服器上,再次掃描資料庫最終求出全域性頻繁項集。這種將關聯規則挖掘演算法與並行處理相結合的方式能更大的提高演算法的效率。今後,如何能夠更有效的提高關聯規則演算法執行的效率,怎樣設計更有效、更實用的演算法,是我們進一步需要思考的問題。
以上是我在社會實踐中悟到的經驗以及思考的課題。
資料庫中的實體,實體型,實體集解析
4樓:匿名使用者
實體型是一種資料型別,既可以是實體,也可以是實體集,實體集就是實體的集合,一個實體是實體也是實體集,多個實體同樣是實體集。實體是表示資料庫中描述的現實世界中的物件或概念,可以看作一個模型。
5樓:淡藍色寶貝
1。實體:客觀存在,可以相互區別的事物稱為實體。
(注意實體是客觀上存在的). 2。實體型:
用實體名及屬性名集合來抽象和刻劃的同類實體。比如,學生(學號,姓名) 3。實體集:
性質相同的同類實體的集合,稱為實體集。比如,(張三,李四) 4。聯絡:
是指實體之間的相互關係。 5。e-r圖:
通常稱為 實體-關係(聯絡)圖,其實是不對的,嚴格的應該叫做實體型-關係(聯絡)圖。因為e-r圖討論的實體不是具體的個體,而是同類實體的一個集合,即實體集,而實體型恰恰可以表達具有這類性質的集合。e-r圖的作用是提供了表示實體型、屬性和聯絡的方法。
繪製e-r圖的過程是在客觀世界與抽象世界之間相互切換,並最終以抽象形式展現的結果。在e-r圖中使用實體型來描述實體集(由客觀世界實體抽象到抽象世界的實體型),考查客觀中具體實體之間的關係並以聯絡來表示(由客觀世界中實體之間的關係抽象到抽象世界的聯絡概念)。
SQL server資料庫內查詢某以資料表內某一產品的一條資料資訊,要怎麼些查詢語句,謝謝了
select from to order,tm tightness where to order to order id 2114g3001 and to order to order id tm tightness.to order id 這段sql有問題,來 你既然 to order to or...
請問資料庫在建立表的時候如何設計表關係,一對一,一對多,多對多請高手舉例說明。謝謝
1 一對一可以兩個實體設計在一個資料庫中l例如設計一個夫妻表,裡面放丈夫和妻子 2 一對多可以建兩張表,將一這一方的主鍵作為多那一方的外來鍵,例如一個學生表可以加一個欄位指向班級 班級與學生一對多的關係 3 多對多可以多加一張中間表,將另外兩個表的主鍵放到這個表中 如教師和學生就是多對多的關係 希望...
excel不顯示資料表之外的部分如何設定
1.新建一個excel空白頁,選出一個工作區域,如圖。2.在選出的工作區域中,點選滑鼠右鍵。選擇,設定單元格格式 在邊框頁面上,把 加上邊框。如圖。3.在設定邊框的最後一豎行上點選,然後按鍵盤 ctrl shift 後,點選右鍵選著 隱藏 選項。這樣右側的 都隱藏了。4.在設定邊框的最好一行上點選,...