Dành cho những ai chưa biết thì GSO gần đây đã cải tiến rất nhiều trong việc update cơ sở dữ liệu quốc gia. Hiện nay, dữ liệu của Tổng cục thống kê, Bộ tài chính và Ngân hàng nhà nước đã được thu về một mối và sử dụng cùng cấu trúc dữ liệu (National Summary Data Page). Bài viết hôm nay sẽ giúp các bạn lấy các dữ liệu đó bằng Python (machine-reading) trực tiếp từ nguồn. Rất có ích cho những người làm về data science và nghiên cứu kinh tế.
Tiếp tục đọcKinh tế học
Economics
Cách lấy dữ liệu từ Tổng cục thống kê (GSO) và tạo hình động biểu đồ GDP
Sau một thời gian thực hành với data science, mình bắt đầu thấy thích việc đọc data online và xử lý trực tiếp qua một loạt các dòng lệnh (script) hơn là download một file .csv hay .xls về và load chúng vào chương trình. Hôm nay, mình sẽ chỉ cho các bạn một tip cực kỳ quan trọng để lấy data từ Tổng cục thống kê (GSO) về, xử lý trực tiếp trên chương trình mà không cần thiết phải save về máy, ngoài ra chúng ta sẽ nghich một chút bằng cách tạo file .gif để xem sự phát triển của nền kinh tế Việt Nam. Bài viết sẽ sử dụng Python, thư viện pandas để xử lý dữ liệu, matplotlib, imageio và numpy để vẽ biểu đồ và hình động.
Tiếp tục đọcĐi du học có “lời” không?
Chắc chắn đây là câu hỏi của rất nhiều người, và hôm nay xin phép dùng dữ liệu thu chi và ít vốn liếng data science của mình trong những năm qua để trả lời. Bài viết này sử dụng file data (.csv) của Money Lover , một ứng dụng tuyệt vời mà mình đã sử dụng từ khi sang Nhật để lưu giữ nhật ký thu nhập và chi tiêu hằng tháng. Các bạn sẽ biết cách vẽ một số biểu đồ stacked bar (cột chồng) để xem balance, cũng như income của mình ra sao và làm treemap (là biểu đồ cây hoặc biểu đồ nhiệt) để xem mình chi cái gì nhiều nhất. Chúng ta sẽ code bằng Python.
Tiếp tục đọcTự phân tích những gì bạn viết trên WordPress bằng Python
Bạn có bao giờ tò mò là trong quá trình viết blog xem là tần suất sử dụng từ của mình như thế nào không? Bạn viết gì nhiều nhất? Bài viết này sẽ hướng dẫn các bạn cách dùng kiến thức data science để trích xuất và xử lý dữ liệu bài viết trên wordpress. Sau đó chúng ta sẽ vẽ 3 biểu đồ: [bar chart] biểu thị tần suất các từ xuất hiện nhiều nhất trên blog, [word cloud] để visualize chúng thành tạo một đám mây chữ và [histogram] để xem sự phân bố của tần suất các chữ được sử dụng. Ngôn ngữ chúng ta sử dụng là Python, và sẽ có một số bước xử lý ngôn ngữ tự nhiên (NPL).
Tiếp tục đọcCách chạy trốn/backup khỏi WordPress.com
Blog của mình vẫn xài wordpress, nhưng mà có xài lâu mới thấy nó có nhiều nhược điểm và hơi hơi tốn kém. Hiện nay chúng ta có lựa chọn, nhiều host free mà các bạn có thể dùng (điển hình như Jekyll). Bài viết này sẽ giúp các bạn backup lại toàn bộ các bài viết của mình trên wordpress.com, chuyển sang định dạng markdown để các bạn tiện xử lý.
Tiếp tục đọcPhân tách tăng trưởng kinh tế hiện đại (APG) p.1: Lý thuyết
Trong kinh tế học truyền thống, các phương pháp phân tích tăng trưởng kinh tế vĩ mô, cụ thể là tăng trưởng năng suất lao động (productivity growth) chủ yếu dựa vào mô hình Solow. Đầu vào của nền kinh tế là K (tư bản), L (lao động) và A (công nghệ). Năng suất lao động hầu hết được hiểu là nằm ở A. Theo lý thuyết này, mô hình Solow có 2 phiên bản chính rất hay được sử dụng, một là Hicks-neutral (trong đó coi A nằm ngoài K và L, còn gọi là TFP), hai là Harrod-neutral (trong đó A được coi là số nhân của L, và lao động thô L trở thành lao động hiệu quả AL). Một số nền kinh tế phát triển như EU, Mỹ, Nhật Bản đã phát triển một hệ thống dữ liệu niên giám cấp ngành rất đồ sộ, và nhờ vậy, việc phân tích tăng trưởng kinh tế hiện đại đã có một bước tiến lớn. Cụ thể, phương pháp dưới đây phân tích tăng trưởng của năng suất lao động không chỉ dựa trên K, L mà thêm vào đó là II (hàng hoá trung gian) và VA (giá trị gia tăng). Bài viết này sẽ trình bày lý thuyết của mô hình (ở phần 1) và ứng dụng của nó vào phân tích tăng trưởng kinh tế của Vương quốc Bỉ (phần 2).
Paper gốc: Petrin, A. and Levinsohn, J. (2012), Measuring aggregate productivity growth using plant-level data. The RAND Journal of Economics, 43: 705-725. https://doi.org/10.1111/1756-2171.12005
Tiếp tục đọcNhật ký Sendai (P17): Ở nhà cách ly đã có Civilization VI
Mùa hè tại Sendai năm nay rất kỳ lạ. Tất cả mọi thứ kết hợp lại nhằm buộc bản phải ở nhà. Sau Olympics, Covid đã lan mạnh hơn tại đây, rồi thì nghỉ hè, rồi thì những trận mưa đã kéo dài suốt hai tuần nay (và dự kiến sẽ tiếp tục trong nhiều ngày tới). Trong thời gian này, may mắn làm sao, các loại game liên tục giảm giá, và mình đã quyết định mua Civilization VI về chơi với cái giá rẻ bất ngờ. Mặc dù không liên quan đến những chủ đề quen thuộc như mọi khi, nhưng quả thực, đây là một tựa game tuyệt vời mà bạn không nên bỏ qua. Trong mùa dịch thế này, đây là tựa game vừa mang tính giải trí, đồng thời cũng mang tính giáo dục rất cao.
Tiếp tục đọcNhật báo Vienna 2021/07/15
Điểm lại một số bài báo nổi bật về kinh tế trên không gian mạng trong ngày.
- The impact of lockdowns on international trade
- Australian labour market – slow employment growth but unemployment continues to fall as population growth remains weak
Mình nghĩ những bài viết này khá bổ ích trong việc học tập cách phân tích dữ liệu kinh tế.
Tiếp tục đọcNhật báo Vienna 2021/07/07
Điểm lại một số bài blog posts nổi bật về kinh tế trên không gian mạng trong ngày.
- Euro Semi-Finals: England is the Favorite! (dùng R dự đoán kết quả Euro)
- Bank of Japan Stops QE, Reserve Bank of Australia Starts Tapering, Bank of Canada & Bank of England Already Tapering, Amid Shock-and-Awe Rate Hikes in Emerging Markets
Nhật báo Vienna 2021/07/05
Điểm lại một số bài blog posts nổi bật về kinh tế trên không gian mạng trong ngày.
- The Delta Variant: Macro Implications
- Ageing, and productivity in teams: Evidence from US court judges
- The Employment Release and Business Cycle Indicators
Bonus:
- US labour market recovery leaves considerable slack and rising long-term unemployment
- (R-bloggers) 10 Tips and Tricks for Data Scientists Vol.10
Nhật báo Vienna 2021/07/02
Điểm lại một số bài blog posts nổi bật về kinh tế trên không gian mạng trong ngày.
- Fed’s Reverse Repos Spike to $1 Trillion. Cash Drain Undoes 8 Months of QE
- How Wages over the Life Cycle Have Changed
- Vietnam’s Economy Picks Up, But Virus Could Weigh on Outlook
Nhật báo Vienna 2021/07/01
Điểm lại một số bài blog posts nổi bật về kinh tế trên không gian mạng trong ngày.
- A Central Bank Digital Currency?
- Workers can unlock the artificial intelligence revolution
- Inaugural FT-IGM survey of academic macroeconomists
- Forecasting in Unprecedented Times
- Eurozone fiscal rules should be based on national macroeconomic stabilisation, not national debt stabilisation
Writing tips in Economics
This is a shortlist of tips from reputable institutions regarding the general rules for writing academic papers/dissertations in Economics. | Danh sách một số hướng dẫn hữu ích về việc viết luận, nghiên cứu, bằng tiếng Anh trong lĩnh vực Kinh tế học.
- On the general academic writing by Prof. Nikolov (Harvard).
A clear and concise guide with various handy examples and sentence expressions that should change your writing habit significantly.
Inclined towards empirical presentation and research papers (not explicitly about thesis but still adaptable).
Link: https://www.people.fas.harvard.edu/~pnikolov/resources/writingtips.pdf
- On the format and technical aspect of a thesis by Prof. Nagayasu’s team (Tohoku)
A comprehensible guide. There are many templates, structural and easy-to-use tips that help even people who know little about coding quickly become familiar with LaTeX. Our program (GPEM) includes a thesis defend presentation so this guide has both the document preparation and presentation preparation, all in LaTeX. Even if you do not intend to write math in your thesis, going for LaTeX is always a win).
Link: https://www.econ.tohoku.ac.jp/english/files2020/GPEM_Latex.pdf
LaTeX thesis template link: http://www.latextemplates.com/template/masters-doctoral-thesis
LaTeX presentation link: https://www.latextemplates.com/template/beamer-presentation
- On the thesis’ structure by Prof. Todo (Waseda).
At the end of the document, there are many useful websites.
Link: http://www.f.waseda.jp/yastodo/laboratory/TipstoWriteAThesis20141119.pdf
Cách trích xuất dữ liệu Apple Health bằng Python
Ở bài này, chúng ta sẽ tìm cách trích xuất dữ liệu của Apple Health (bao gồm số bước chạy, quãng đường di chuyển hay thời gian ngủ). Dữ liệu của Apple Health được lưu dưới định dạng .xml nên việc lọc dữ liệu sẽ vất vả hơn so với .csv. Tuy nhiên, với Google là người bạn thân thiết thì chúng ta hoàn toàn có thể xử lý được. Cần một chút kiến thức Data Science, nhưng không có gì phức tạp lắm.
How to extract Apple Health data in Python.
Tiếp tục đọcCách trích xuất dữ liệu WordPress Stats bằng Python
Sau một thời gian hoạt động, chắc chắn các bạn muốn biết blog của mình hoạt động ra sao. Cách đơn giản nhất để xem những dữ liệu thống kê này là vào phần /wp-admin và click vào “Site Stats”. Tuy nhiên, nếu các bạn muốn download những dữ liệu đó về máy để tự mình xử lý thì làm thế nào? Bằng một số kiến thức Python và data science cơ bản, chúng ta có thể làm được điều đó.
How to extract your own wordpress.com stats using Python.
Tiếp tục đọc