教學大綱 Syllabus

科目名稱:資料探勘

Course Name: Data Mining

修別:選

Type of Credit: Elective

3.0

學分數

Credit(s)

30

預收人數

Number of Students

課程資料Course Details

課程簡介Course Description

本課程主要在培養同學資料探勘(Data Mining)技術與演算法之基礎。在授課方向上,將以培養同學資料探勘演算法的基礎研究能力為主。

先修課程:程式設計、線性代數、資料結構、演算法、資料庫系統

先備技術: Python, DBMS, Github

核心能力分析圖 Core Competence Analysis Chart

能力項目說明


    課程目標與學習成效Course Objectives & Learning Outcomes

    學習目標:培養同學資料探勘演算法的基礎研究能力

    學習成效:

    (1) 資料探勘的專業知識

    (2) 資料探勘演算法的設計思維

     

    每周課程進度與作業要求 Course Schedule & Requirements

    教學週次Course Week 彈性補充教學週次Flexible Supplemental Instruction Week 彈性補充教學類別Flexible Supplemental Instruction Type

    第一週 Introduction to Data Mining (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習3 hr.)

    第二週 Frequent Pattern Mining: Apriori Algorithms, FP-Trees (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習4 hr.)

    第三週 Frequent Pattern Mining: Quantitative Association Rules, Ratio Rules (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習4 hr.)

    第四週 Frequent Pattern Mining: Association and Causial Relatiobships, Applications  (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習4 hr.)

    第五週 Data Preprocessing (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習4 hr.)

    第六週 Classification Algorithms: Introduction, Decision Tree, Rule-based Classisifer (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習4 hr.)

    第七週 Classification Algorithms: Associated Classification, Naïve Bayes Classifier, K-NN (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習4 hr.)

    第八週 Classification Algorithms: Support Vector Machines, Ensemble Algorithms(指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習4 hr.)

    第九週 Classification Algorithms: Feature Engineering, Data Imbalance, Data Leakage (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習4 hr.)

    第十週 Clustering:Introduction, Similarity and Distance, K-Means (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習4 hr.)

    第十ㄧ週 Clustering: Hierarchical Clustering, Chameleon (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習4 hr.)

    第十二週 Clustering: DBscan, Gausian Mixture Model(指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習4 hr.)

    第十三週 Data Warehousing and Online Analytical Processing (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習5 hr.)

    第十四週 Dimensionality Reduction: Singular Value Decomposition, PCA (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習5 hr.)

    第十五週  Recommendation: Content-based, Collaborative-based Filtering, Matrix Factorization (指定閱讀課本, 講課與討論, 課前預習1 hr., 課後複習5 hr.)

    第十六週 期末考

    第十七週 完成學期專題(彈性補充教學)

    第十八週 完成學期專題(彈性補充教學)

     

     
     

     

     

     
     

     

     

    授課方式Teaching Approach

    70%

    講述 Lecture

    10%

    討論 Discussion

    10%

    小組活動 Group activity

    10%

    數位學習 E-learning

    0%

    其他: Others:

    評量工具與策略、評分標準成效Evaluation Criteria

    評量工具:期末考試、程式作業、學期專題

    評分標準(暫定):根據考試成績、程式作業與學期專題成果評分

    期末考 40~50%

    作業 20~30% (4個Data Mining程式作業)

    學期專題 20~30% ( Kaggle競賽,評分考量包括競賽名次、Algorithm Design, Feature Engineering)

     

    指定/參考書目Textbook & References

    指定書目:

    . Introduction to Data Mining, P. N. Tan, M. Steinbach, A. Karpatne and V. Kumar, Pearson, 2nd Ed., 2018.

    . Data Mining: Concepts and Techniques, J. Han and M. Kamber, Morgan Kaufmann, 3rd Ed., 2012.

     

    已申請之圖書館指定參考書目 圖書館指定參考書查詢 |相關處理要點

    維護智慧財產權,務必使用正版書籍。 Respect Copyright.

    課程相關連結Course Related Links

    . 課程教材連結
    http://wm5.nccu.edu.tw

    課程附件Course Attachments

    課程進行中,使用智慧型手機、平板等隨身設備 To Use Smart Devices During the Class

    需經教師同意始得使用 Approval

    列印