Cài Đặt Các Bộ Thư Viện Cho Python

  -  
Cài đặt môi trường và thư viện cho Machine LearningPythonPython là ngôn ngữ lập trình rất phổ biến trong cả môi trường học thuật và công nghiệp. Theo số liệu từ IEEE Spectrum, Python đã đứng hạng nhất trên bảng xếp hạng những ngôn ngữ phổ biến vào tháng 8/2018. Python được thiết kế hướng đến việc dễ đọc hiểu, gần với ngôn ngữ tự nhiên (tiếng Anh) và sử dụng nhóm các từ vựng toán học.

Bạn đang xem: Cài đặt các bộ thư viện cho python

Có lẽ Python là ngôn ngữ lập trình dễ tiếp cận nhất. Một lập trình viên với nền tảng cơ bản có thể "master" và bắt đầu bắt tay vào thực hiện một dự án nho nhỏ chỉ sau vài ngày tìm hiểu, thực hành với Python. Điều này thật sự rất có ý nghĩa, đặc biệt là đối với người làm trong môi trường học thuật bởi không cần tốn quá nhiều công sức cho việc tìm hiểu ngôn ngữ, môi trường phát triển, để dành năng lượng vào việc giải quyết các vấn đề nghiên cứu.

Mặc dù đơn giản, dễ tiếp cận, Python đồng thời cũng vô cùng mạnh mẽ, hỗ trợ cả lập trình thủ tục, lập trình hàm và (tất nhiên) lập trình hướng đối tượng.

Python làm việc trên hầu như mọi nền tảng: Windows, Mac, Linux, Raspberry, etc

Hiện nay tồn tại song song hai phiên bản là Python2 và Python3, trong đó Python2 đã không còn được hỗ trợ cập nhật thêm mới bất cứ thứ gì ngoài các gói security updates. Mặc dù vậy, Python2 vẫn được sử dụng khá phổ biến.

Các gói thư viện cho Python có thể được dễ dàng cài đặt và quản lý bởi công cụ PIP (pip installs packages)

Cài đặt Python

Khi không bị ràng buộc bởi các dự án cũ, phát triển bởi Python2 thì bản Python3 được khuyến nghị sử dụng. Có hai lựa chọn cài đặt Python: Cài đặt từ bản phân phối chính thức từ python.org/downloads; Hoặc cài đặt thông qua Anaconda.

Cài đặt Python từ python.org

Tải bộ cài đặt tại python.org/downloads

*

Lựa chọn bản cài đặt phù hợp với nền tảng sử dụng (Windows, Mac, Linux, etc). Bài viết này hướng dẫn cài đặt Python 3.7.0 trên môi trường Windows.

Sau khi download bộ cài, thực hiện cài đặt Python trên Windows như sau:

*

Đánh dấu chọn mục "Add Python 3.7 to PATH" để trình cài đặt tự động thêm đường dẫn của Python vào biến môi trường, sau đó nhấp "Install Now"

Cài đặt Python thông qua Anaconda

Anaconda là một bản phát hành Python dành cho các ứng dụng liên quan đến khoa học dữ liệu và máy học, với mục đích đơn giản hóa việc quản lý gói thư viện và triển khai ứng dụng. Phiên bản gói thư viện được quản lý bởi Package Management System conda

Anaconda đồng thời cung cấp tính năng tạo các môi trường ảo hoàn toàn độc lập với nhau và độc lập với môi trường Python của hệ điều hành nếu được cài sẵn hoặc cài đặt từ bản phân phối chính thức

Bản phân phối Anaconda cũng được đóng gói sẵn hơn 250 gói thư viện thông dụng dành cho khoa học dữ liệu, phù hợp cho Windows, MacOS, LinuxBước đầu tiên, tải Anaconda tại https://www.anaconda.com/download/

*

Lưu ý tải đúng bản cho nền tảng đang sử dụng. Bài viết này hướng dẫn cài đặt trên Windows, bản phân phối Python 3.6, 64-bit.

Xem thêm: 999+ Những Câu Nói Hay Về Gia Đình ❤️❤️❤️ Nên Đọc

Sau khi tải bản cài đặt, thực hiện cài đặt theo các bước sau:

*

Nhấp Next > I Agree

*

Chọn "Install for: All Users", nhấp Next >, tiếp tục nhấp Next > cho đến bước sau:

*

Đánh dấu chọn cả 2 mục thuộc Advanced Options như hình minh họa, nhấp InstallSau khi kết thúc cài đặt, để kiểm tra việc cài đặt có thành công hay không, chạy command line (cmd.exe) và gõ thử lệnh

> condaNếu cài đặt thành công, command line sẽ hiển thị như sau:

*

Để kiểm tra việc cài đặt Python, từ trình Command Line, gõ lệnh:

> pythonCommand line sẽ có các thông tin như sau:

*

Cài đặt thư viện cho Machine LearningCác thư viện dành cho khoa học dữ liệu, máy học cơ bản gồm NumPy, Scikit-Learn, Matplotlib, Tensorflow, Keras, etc. Trong trường hợp cài đặt Python từ bản phân phối Anaconda, các thư viện kể trên đã được đóng gói sẵn, không cần cài đặt riêng lẻ. Nếu là Python từ bản phân phối chính thức từ Python.Org, cần cài đặt các gói riêng lẻ bằng công cụ PIP

NumPy

NumPy là gói thư viện cơ bản dành cho khoa học máy tính trên Python, được thiết kế để xử lý dữ liệu dạng mảng, ma trận. Việc xử lý, tính toán dữ liệu dạng mảng với kích thước lớn, nhiều chiều, số lượng bản ghi tùy ý trên NumPy hết sức hiệu quả mà không phải hy sinh quá nhiều về tốc độ so với mảng nhiều chiều kích thước nhỏ. NumPy bao gồm các thành phần:

N-dimensional array objectCác hàm tính toán phức tạpCác thuật toán thuộc Linear Algebra, Fourier TransformBộ sinh số giả ngẫu nhiên với đầy đủ các phương pháp, các tùy chọn

NumPy đóng vai trò quan trọng trong khoa học máy tính. Rất nhiều các thư viện khác được xây dựng bên trên NumPy, sử dụng kiểu dữ liệu mảng nhiều chiều của NumPy như là định dạng dữ liệu chuẩn. Các hàm, các phương thức làm việc với ma trận của NumPy rất ngắn gọn, tiện lợi và hiệu năng cao.

Để cài đặt NumPy sử dụng PIP, thực hiện lệnh sau trên command line (hoặc terminal trên môi trường linux, macos):

> pip install numpyHoặc sử dụng công cụ quản lý packages conda:

> conda install numpyĐiểm cần lưu ý, một số thư viện được xây dựng bên trên thư viện NumPy đòi hỏi phiên bản NumPy dựa trên thư viện MKL (math kernel library - thư viện tối ưu tính toán được phát triển bởi Intel). Trong trường hợp đó, cần phải cài đặt gói numpy-mkl bằng cách sau:

Từ cmd di chuyển đến thư mục có chứa file whl đã tải vềNhập lệnh: > pip install numpy‑1.15.0+mkl‑cp37‑cp37m‑win_amd64.whl (giả sử file whl đã download có tên như vậy - phù hợp cho Python 3.7, môi trường Windows 64bit)

Matplotlib

Đây là gói thư viện vô cùng hiệu quả để vẽ đồ thị 2D cho Data Visualization. Matplotlib bao gồm rất phong phú các dạng đồ thị. Người dùng có thể dễ dàng tạo plots, histograms, power spectra, bar charts, errorcharts, scatterplots, etc.. với chỉ vài dòng code.

Matplotlib được tích hợp rất nhiều plug-ins hữu ích, đặc biệt là mplot3d cho vẽ đồ thị 3DĐể cài đặt Matplotlib cho Python, trên cmd nhập lệnh:

> pip install matplotlib

Scikit-Learn

Scikit-Learn là thư viện cho các ứng dụng máy học rất nổi tiếng, mã nguồn mở và được cấp phép cho môi trường phát triển ứng dụng doanh nghiệp. Scikit-Learn được xây dựng bên trên NumPy, Scipy, và Matplotlib. Thư viện này là một công cụ hết sức hiệu quả cho các bài toán khai phá dữ liệu và phân tích dữ liệu, với đầy đủ các thuật toán máy học được cài đặt sẵn.Để cài đặt Scikit-Learn sử dụng công cụ PIP, nhập lệnh sau trên cmd:

> pip install scikit-learn

Tensorflow

Tensorflow là thư viện vô cùng nổi tiếng, được phát triển bởi Google Brain. Mới đầu Tensorflow chỉ được sử dụng nội bộ bên trong Google. Cho đến tháng 11 năm 2015, Tensorflow được phát hành dưới giấy phép mã nguồn mở Apache 2.0. Từ đó đến nay, thư viện này phát triển một cách thần tốc, trở thành thư viện cho Machine Learning, Deep Learning hàng đầu. Tensorflow được ứng dụng trong cả nghiên cứu lẫn phát triển ứng dụng.

Việc cài đặt các kỹ thuật Deep Learning trở lên hết sức thuận tiện bởi Tensorflow cung cấp các Python API dễ sử dụng.

Tensorflow hiện nay đã hỗ trợ hầu như đầy đủ các nền tảng, kể cả Mobiles, Raspberry, Browsers (với tensorflow.js).

Để cài đặt Tensorflow, từ cmd nhập lệnh:

> pip install tensorflowĐối với máy tính có tích hợp GPU của NVIDIA, cần cài đặt bản built sẵn hỗ trợ GPU để tăng tốc độ tính toán (lên nhiều lần), bằng lệnh:

> pip install tensorflow-gpuCác cách kể trên sẽ cài đặt thư viện Tensorflow dựa trên bản phân phối chuẩn, được built sẵn với tiêu chí phù hợp với đa số các thiết bị. Vì vậy nó có thể không tối ưu cho một thiết bị nhất định. Ví dụ bản build tiêu chuẩn không hỗ trợ công nghệ AVX, FMA, SSE. Vì vậy với máy tính có CPU hỗ trợ các công nghệ kể trên, cần phải có bản built phù hợp để khai thác tối đa khả năng tính toán (với AVX2, SSE 4.2 hiệu năng tính toán có thể cải thiện đến 3 lần). Trong trường hợp này, cần thực hiện build Tensorflow với các tùy chọn tối ưu cho thiết bị, nhưng đó không phải là việc đơn giản với tất cả mọi người. May mắn là trên Internet có sẵn một kho chứa gần như tất cả các bản built sẵn với các tùy chọn khác nhau và được cập nhật thường xuyên cùng với phiên bản mới phát hành của Tensorflow: https://backlinks.vn.com/lakshayg/tensorflow-build. Để cài đặt, trước tiên cần download file đóng gói whl phù hợp với môi trường hệ thống, đặc điểm phần cứng, phiên bản Python trên máy, phiên bản Tensorflow, etc.. Sau khi tải về, từ cmd di chuyển đến thư mục chứa file whl và nhập lệnh:

> pip install tensorflow-1.9.0-cp36-cp36m-macosx_10_13_x86_64.whlVới giả thiết cài đặt Tensorflow phiên bản 1.9.0 trên MacOS với phiên bản Python 3.6.Một điều lưu ý là Tensorflow hiện không hỗ trợ build trên môi trường Windows. Vì vậy chỉ có thể cài đặt Tensorflow bằng bản phân phối chuẩn thông thường.

Xem thêm: Hướng Dẫn Đường Đi Đất Mũi Cà Mau Tự Túc 2021, Đường Đi Đến Đất Mũi

Sau khi cài đặt Tensorflow, để chắc chắn quá trình cài đặt là thành công có thể kiểm tra bằng cách thực hiện chạy một đoạn script Python trên cmd như sau:

Với bản build cho CPU:

> python

Hello, Tensorflowthì việc cài đặt đã thành công.

Với bản build cho GPU:

> python