Xử lý dữ liệu kinh tế từ GSO (National Summary Data Page)

Xử lý dữ liệu kinh tế từ GSO (National Summary Data Page)

Dành cho những ai chưa biết thì GSO gần đây đã cải tiến rất nhiều trong việc update cơ sở dữ liệu quốc gia. Hiện nay, dữ liệu của Tổng cục thống kê, Bộ tài chính và Ngân hàng nhà nước đã được thu về một mối và sử dụng cùng cấu trúc dữ liệu (National Summary Data Page). Bài viết hôm nay sẽ giúp các bạn lấy các dữ liệu đó bằng Python (machine-reading) trực tiếp từ nguồn. Rất có ích cho những người làm về data science và nghiên cứu kinh tế.

Tiếp tục đọc
Cách lấy dữ liệu từ Tổng cục thống kê (GSO) và tạo  hình động biểu đồ GDP

Cách lấy dữ liệu từ Tổng cục thống kê (GSO) và tạo hình động biểu đồ GDP

Sau một thời gian thực hành với data science, mình bắt đầu thấy thích việc đọc data online và xử lý trực tiếp qua một loạt các dòng lệnh (script) hơn là download một file .csv hay .xls về và load chúng vào chương trình. Hôm nay, mình sẽ chỉ cho các bạn một tip cực kỳ quan trọng để lấy data từ Tổng cục thống kê (GSO) về, xử lý trực tiếp trên chương trình mà không cần thiết phải save về máy, ngoài ra chúng ta sẽ nghich một chút bằng cách tạo file .gif để xem sự phát triển của nền kinh tế Việt Nam. Bài viết sẽ sử dụng Python, thư viện pandas để xử lý dữ liệu, matplotlib, imageio và numpy để vẽ biểu đồ và hình động.

Tiếp tục đọc
Đi du học có “lời” không?

Đi du học có “lời” không?

Chắc chắn đây là câu hỏi của rất nhiều người, và hôm nay xin phép dùng dữ liệu thu chi và ít vốn liếng data science của mình trong những năm qua để trả lời. Bài viết này sử dụng file data (.csv) của Money Lover , một ứng dụng tuyệt vời mà mình đã sử dụng từ khi sang Nhật để lưu giữ nhật ký thu nhập và chi tiêu hằng tháng. Các bạn sẽ biết cách vẽ một số biểu đồ stacked bar (cột chồng) để xem balance, cũng như income của mình ra sao và làm treemap (là biểu đồ cây hoặc biểu đồ nhiệt) để xem mình chi cái gì nhiều nhất. Chúng ta sẽ code bằng Python.

Tiếp tục đọc
Cách gõ tiếng Việt và tiếng Nhật (Trung, Hàn) trong LaTeX

Cách gõ tiếng Việt và tiếng Nhật (Trung, Hàn) trong LaTeX

Thực ra với các package hiện tại thì gõ tiếng Việt trên LaTeX không khó lắm, vì gói ngôn ngữ babel hỗ trợ khá tốt vấn đề này. Tuy nhiên, gõ tiếng Nhật (hay Trung, Hàn, gọi chung là nhóm ngôn ngữ CJK) thì cần một số thủ thuật để việc nhập liệu của các bạn trở nên trơn tru hơn.

Tiếp tục đọc
Nhật ký Sendai (P19): Để có những năm tháng Ph.D. thành công

Nhật ký Sendai (P19): Để có những năm tháng Ph.D. thành công

Mục này không phải là những lời khuyên do mình đưa ra, mà là sưu tầm trên mạng, đọc thấy hữu dụng nên share ở post này. Hầu hết là những lời khuyên áp dụng cho ngành Kinh tế, nhưng nhìn rộng ra thì cũng sẽ có những thứ có ích cho các ngành khác nữa. Bài viết này cũng là để mình tự nhắn nhủ với bản thân trước những thử thách sắp tới vì kỳ học Ph.D. đã bắt đầu từ hôm nay rồi.

Tiếp tục đọc
Writing tips in Economics

Writing tips in Economics

This is a shortlist of tips from reputable institutions regarding the general rules for writing academic papers/dissertations in Economics. | Danh sách một số hướng dẫn hữu ích về việc viết luận, nghiên cứu, bằng tiếng Anh trong lĩnh vực Kinh tế học.

  • On the general academic writing by Prof. Nikolov (Harvard).
    A clear and concise guide with various handy examples and sentence expressions that should change your writing habit significantly.
    Inclined towards empirical presentation and research papers (not explicitly about thesis but still adaptable).
    Link: https://www.people.fas.harvard.edu/~pnikolov/resources/writingtips.pdf
Tiếp tục đọc
Cách trích xuất dữ liệu Apple Health bằng Python

Cách trích xuất dữ liệu Apple Health bằng Python

Ở bài này, chúng ta sẽ tìm cách trích xuất dữ liệu của Apple Health (bao gồm số bước chạy, quãng đường di chuyển hay thời gian ngủ). Dữ liệu của Apple Health được lưu dưới định dạng .xml nên việc lọc dữ liệu sẽ vất vả hơn so với .csv. Tuy nhiên, với Google là người bạn thân thiết thì chúng ta hoàn toàn có thể xử lý được. Cần một chút kiến thức Data Science, nhưng không có gì phức tạp lắm.

How to extract Apple Health data in Python.

Tiếp tục đọc
Cách trích xuất dữ liệu WordPress Stats bằng Python

Cách trích xuất dữ liệu WordPress Stats bằng Python

Sau một thời gian hoạt động, chắc chắn các bạn muốn biết blog của mình hoạt động ra sao. Cách đơn giản nhất để xem những dữ liệu thống kê này là vào phần /wp-admin và click vào “Site Stats”. Tuy nhiên, nếu các bạn muốn download những dữ liệu đó về máy để tự mình xử lý thì làm thế nào? Bằng một số kiến thức Python và data science cơ bản, chúng ta có thể làm được điều đó.

How to extract your own wordpress.com stats using Python.

Tiếp tục đọc
Cách viết Research Plan (研究計画) bằng tiếng Nhật

Cách viết Research Plan (研究計画) bằng tiếng Nhật

Hiện tại nhu cầu du học cao học tại Nhật Bản đang ngày càng tăng. Và tất nhiên, khi đăng ký cho một chương trình cao học nào đó (ở bậc Thạc Sĩ hoặc Tiến Sĩ) hay trong quá trình xin học bổng, chúng ta đều phải viết Kế hoạch nghiên cứu (Research Plan/Research Proposal (RP), trong tiếng Nhật gọi là 研究計画). Nếu các bạn còn đang mông lung thì hi vọng sau khi đọc bài này xong sẽ sáng tỏ ra được nhiều điều. Bài viết sẽ giúp các bạn trả lời các câu hỏi: Nội dung yêu cầu của một bài RP trong tiếng Nhật là gì? Cấu trúc như thế nào? Cần chú ý những gì và quan trọng nhất là một số tips, tài liệu tham khảo và ví dụ mẫu (mình lấy nguồn từ giáo sư người Nhật và từ bài của bản thân nhưng đã được người Nhật proofread).

Tiếp tục đọc