Nhật ký Sendai (P21): Suy ngẫm về thuyết tương đối của ngôn ngữ

Nhật ký Sendai (P21): Suy ngẫm về thuyết tương đối của ngôn ngữ

Các bạn có biết người Pirahã sống ở vùng Amazon, Brazil nói một thứ ngôn ngữ không có số không? Một số học giả nói rằng họ không biết đếm từng số một, mà chỉ có từ như “ít” và “nhiều” để phân biệt số lượng. Chính vì thế, những thổ dân này gần như không có khả năng lĩnh hội các khái niệm toán chính xác, chứ đừng nói đến đại số phức tạp. Việc ngôn ngữ chúng ta nói định hình khả năng nghĩ và tư duy của chúng ta được gọi là thuyết Tương đối của ngôn ngữ (linguistic relativity). Cá nhân mình thì rất đồng tình với giả thuyết này. Mình có dịp tiếp xúc với nhiều bạn sinh viên quốc tế ở trường Tohoku, và thường xuyên nói chuyện với họ khiến mình nhận ra nhiều đặc điểm rất thú vị mà chắc chắn có liên quan đến thuyết này.

Tiếp tục đọc
Đi du học có “lời” không? Tổng kết thu chi hằng tháng bằng Money Lover và Python

Đi du học có “lời” không? Tổng kết thu chi hằng tháng bằng Money Lover và Python

Chắc chắn đây là câu hỏi của rất nhiều người, và hôm nay xin phép dùng dữ liệu thu chi và ít vốn liếng data science của mình trong những năm qua để trả lời. Bài viết này sử dụng file data (.csv) của Money Lover , một ứng dụng tuyệt vời mà mình đã sử dụng từ khi sang Nhật để lưu giữ nhật ký thu nhập và chi tiêu hằng tháng. Các bạn sẽ biết cách vẽ một số biểu đồ stacked bar (cột chồng) để xem balance, cũng như income của mình ra sao và làm treemap (là biểu đồ cây hoặc biểu đồ nhiệt) để xem mình chi cái gì nhiều nhất. Chúng ta sẽ code bằng Python.

Tiếp tục đọc
Tự phân tích những gì bạn viết trên WordPress bằng Python

Tự phân tích những gì bạn viết trên WordPress bằng Python

Bạn có bao giờ tò mò là trong quá trình viết blog xem là tần suất sử dụng từ của mình như thế nào không? Bạn viết gì nhiều nhất? Bài viết này sẽ hướng dẫn các bạn cách dùng kiến thức data science để trích xuất và xử lý dữ liệu bài viết trên wordpress. Sau đó chúng ta sẽ vẽ 3 biểu đồ: [bar chart] biểu thị tần suất các từ xuất hiện nhiều nhất trên blog, [word cloud] để visualize chúng thành tạo một đám mây chữ và [histogram] để xem sự phân bố của tần suất các chữ được sử dụng. Ngôn ngữ chúng ta sử dụng là Python, và sẽ có một số bước xử lý ngôn ngữ tự nhiên (NPL).

Tiếp tục đọc
Căn phòng tiếng Trung

Căn phòng tiếng Trung

là một trong những thought-experiment (thí nghiệm tưởng tượng) nổi tiếng nhất về Trí tuệ nhân tạo. Nó được phát biểu lần đầu tiên vào năm 1980 bởi một nhà triết học người Mỹ – John Searle. Tên tiếng Anh của nó là “The Chinese Room”.

Hãy tưởng tượng: Bạn không hề biết một chút gì về tiếng Trung, bạn ở trong một căn phòng kín mít. Nhiệm vụ của bạn là nhận những câu hỏi bằng tiếng Trung (input), biên dịch chúng và trả về output dưới dạng câu trả lời. Mặc dù không biết tí gì về tiếng Trung, nhưng bằng cách sử dụng các quy tắc quy đổi, so sánh, đối chiếu và biến tấu, v.v.. bạn vẫn có thể đưa ra output một cách hợp lý. Coi như bạn có một cuốn đại cẩm nang về tiếng Trung. Giả sử bạn thực hiện công việc này một cách cực kỳ trơn tru, thì nếu dựa trên kết quả đầu ra, một người bản ngữ hoàn toàn có thể cho rằng có một người bản ngữ đang ở trong căn phòng trên.

Tuy nhiên, câu hỏi thực sự là bạn có được coi là hiểu tiếng Trung không?

Tiếp tục đọc
Dành cho những người thấy việc học là khó, nhưng không muốn từ bỏ …

Dành cho những người thấy việc học là khó, nhưng không muốn từ bỏ …

Đôi khi, chúng ta cần làm điều gì đó để lấy lại động lực làm việc.

Học tiếng Nhật, học môn chuyên ngành, nghiên cứu, lập trình, v.v.. Bất cứ hoạt động nào yêu cầu sự sáng tạo, tích luỹ tri thức đều sẽ có những giây phút khiến bạn muốn bỏ cuộc. Khi đó bạn cần …

Tiếp tục đọc
Cách chạy trốn/backup khỏi WordPress.com

Cách chạy trốn/backup khỏi WordPress.com

Blog của mình vẫn xài wordpress, nhưng mà có xài lâu mới thấy nó có nhiều nhược điểm và hơi hơi tốn kém. Hiện nay chúng ta có lựa chọn, nhiều host free mà các bạn có thể dùng (điển hình như Jekyll). Bài viết này sẽ giúp các bạn backup lại toàn bộ các bài viết của mình trên wordpress.com, chuyển sang định dạng markdown để các bạn tiện xử lý.

Tiếp tục đọc
Nhật ký Sendai (P20): Tôi bắt đầu nghiện Sci-fi | Nhìn lại những sách đã đọc trong năm 2021

Nhật ký Sendai (P20): Tôi bắt đầu nghiện Sci-fi | Nhìn lại những sách đã đọc trong năm 2021

Thế là mình đã hoàn thành mục tiêu Goodreads của năm 2021 (phew). Một năm qua mình phát hiện ra 3 điều thú vị về sách. Một, như tiêu đề đã đề cập, mình bắt đầu nghiện đọc sci-fi (hay là khoa học viễn tưởng), đặc biệt là loại “hard sci-fi”, tức là nhấn mạnh vào tính đúng đắn của khoa học. Hai, mình không ngại đọc sách/tiểu thuyết dài bằng tiếng Anh nữa. Từ hồi vào Master thì đã hết ngại đọc sách giáo trình tiếng Anh. Ba, Covid-19 thực sự đã giúp mình đọc nhiều hơn, nhờ tiết kiệm thời gian đi chơi với bạn bè và chính sự chán chường gây ra bởi đại djich đã đưa mình đến sci-fi. Bài viết này sẽ tổng hợp lại một số cuốn tâm đắc nhất mình đã may mắn đọc được.

Tiếp tục đọc
Phương pháp học từ vựng và ngoại ngữ

Phương pháp học từ vựng và ngoại ngữ

Mình sẽ chia sẻ cho các bạn một số phương pháp học từ vựng với bất kỳ một ngôn ngữ mới nào, lấy cảm hứng từ nhiều polygots nổi tiếng thế giới.

Tiếp tục đọc
Cách gõ tiếng Việt và tiếng Nhật (Trung, Hàn) trong LaTeX

Cách gõ tiếng Việt và tiếng Nhật (Trung, Hàn) trong LaTeX

Thực ra với các package hiện tại thì gõ tiếng Việt trên LaTeX không khó lắm, vì gói ngôn ngữ babel hỗ trợ khá tốt vấn đề này. Tuy nhiên, gõ tiếng Nhật (hay Trung, Hàn, gọi chung là nhóm ngôn ngữ CJK) thì cần một số thủ thuật để việc nhập liệu của các bạn trở nên trơn tru hơn.

Tiếp tục đọc
Đừng chỉ dừng lại ở Stata và Word!

Đừng chỉ dừng lại ở Stata và Word!

Đối với các bạn học kinh tế thì Stata và Word là hai công cụ không thể thiếu rồi. Tuy nhiên, với dòng chảy của thời đại bây giờ, việc chỉ thành thạo hai công cụ này là không đủ ở cao học, và thậm chí ở bậc đại học cũng chưa đủ. Bài viết này nhằm nêu lên tầm quan trọng của việc học code (nhất là các ngôn ngữ mã nguồn mở) càng sớm càng tốt, thông qua trải nghiệm của bản thân. Khối KHTN-kỹ thuật thì không nói, nhưng thậm chí cả những bạn học và nghiên cứu về các khối ngành xã hội khác như ngôn ngữ học, sử, địa, việc viết về lập trình cũng rất có ích.

Tiếp tục đọc
Nhật ký Sendai (P19): Để có những năm tháng Ph.D. thành công

Nhật ký Sendai (P19): Để có những năm tháng Ph.D. thành công

Mục này không phải là những lời khuyên do mình đưa ra, mà là sưu tầm trên mạng, đọc thấy hữu dụng nên share ở post này. Hầu hết là những lời khuyên áp dụng cho ngành Kinh tế, nhưng nhìn rộng ra thì cũng sẽ có những thứ có ích cho các ngành khác nữa. Bài viết này cũng là để mình tự nhắn nhủ với bản thân trước những thử thách sắp tới vì kỳ học Ph.D. đã bắt đầu từ hôm nay rồi.

Tiếp tục đọc
Nhật ký Sendai (P18): Có một thành phố rất “Mỹ” ở Hokkaido

Nhật ký Sendai (P18): Có một thành phố rất “Mỹ” ở Hokkaido

Ở Nhật gần 2 năm rồi mà bây giờ mới được đi lên Hokkaido các bạn ạ, cũng chỉ tại Covid. Nơi này thì quá nổi tiếng rồi, từ thành phố Sapporo nói riêng cho đến đảo Hokkaido nói chung, luôn đứng top 1 trong những nơi đáng sống và đáng du lịch nhất Nhật Bản. Sau chuyến đi vừa rồi, mình đã hiểu phần nào vì sao.

Tiếp tục đọc
Truyện kể Kanji (số 15): Thiên biến vạn hoá

Truyện kể Kanji (số 15): Thiên biến vạn hoá

Ai học tiếng Nhật đều biết rằng, chữ kanji mà có 2 chữ Hán đi cùng nhau thì sẽ đọc theo âm On-yomi, còn nếu đi một mình kèm theo chữ mềm, hoặc tên người thì sẽ đọc theo âm Kun-yomi. Ồ, nếu chỉ có như vậy thì tiếng Nhật đã không khó đến mức đấy. Kỳ thực, quy tắc trên chỉ mang tính tương đối và các trường hợp ngoại lệ thì nhiều vô kể. Điển hình nhất, trong thời điểm này, không gì khác ngoài Virus Corona.

Trong chương trình “Đường lên đỉnh Olympia tiếng Nhật”, vòng thi Về đích, một thí sinh được hỏi câu sau:

Diệp Chi: Bạn hãy cho biết cách đọc đúng của từ 新型コロナ・ウイルス

Táo: Ồ, dễ thế. Hai chữ Hán đi cùng nhau, vậy ắt hẳn phải đọc theo âm Hán rồi!

Diệp Chi: Vậy câu trả lời cuối cùng của em là gì?

Táo: Em chọn SHINKEI Corona Virus.

Diệp Chi: ….. Rất đáng tiếc cho Táo, đây không phải câu trả lời đúng. Cơ hội cho các thí sinh còn lại.

Lê: (bấm chuông đầu tiên) Thưa chị, vậy đó chắc hẳn phải là ATARAGATA Corona Virus!

Diệp Chi: … Rất tiếc. Đây vẫn chưa phải câu trả lời đúng.

Diệp Chi: … Đáp án đúng của chương trình là SHINGATA (Corona Virus). Chúng ta phải lấy đầu của bạn Táo ghép với đuôi của bạn Lê mới ra được câu trả lời chính xác nhé.

Táo,Lê: Nhưng… tại sao hả chị?

Diệp Chi: … Để trả lời câu hỏi này, xin mời “chuyên gia” tư vấn của chương trình, bạn Kiyoshi !

Cảm ơn MC Diệp Chi đã trao cơ hội. Dưới đây, tôi rất hân hạnh được đưa ra câu trả lời 😀

Tiếp tục đọc
Kho tài nguyên tự học tiếng Nhật

Kho tài nguyên tự học tiếng Nhật

Đây là một bài viết khá tham vọng, nhằm tổng hợp lại tất cả những nguồn học tiếng Nhật tốt nhất mà mình thường xuyên sử dụng. Những nguồn này đã giúp ích cho mình rất nhiều khi tự học tiếng Nhật, cũng như trong việc dạy tiếng Nhật cho các bạn khác. Tất cả tài nguyên, giống như blog của mình, đều là miễn phí, và bạn nào đang học tiếng Nhật cũng đều có thể sử dụng được. Một số tài liệu thì sẽ phục vụ tốt hơn cho những bạn đang ở trình độ trung cấp đến thượng cấp (N2, N1 hoặc cao hơn). Mình sẽ liên tục update trang này khi mình tìm được cái gì mới. Nếu các bạn có tài nguyên nào hay muốn chia sẻ thì cũng hãy để lại comment nhé.
#Japanese learning resource

Updated: 2021/04/22

Tiếp tục đọc
Nhật ký Sendai (P16): Đi ngắm hoa anh đào ở Ogawara (tỉnh Miyagi)

Nhật ký Sendai (P16): Đi ngắm hoa anh đào ở Ogawara (tỉnh Miyagi)

Năm nay hoa anh đào nở sớm hơn mọi năm khoảng 2 tuần. Do đó, mặc dù Covid vẫn chưa có dấu hiệu hạ nhiệt, nhiều người (trong đó có mình :p ) vẫn bất chấp đi ngắm hoa. Tất nhiên là khẩu trang và khử khuẩn luôn luôn trên người. Hoa năm nay đẹp lắm các bạn ạ. Mà đúng là phải đi mới thấy nó đẹp như nào, chứ chỉ quanh quẩn ở công viên như năm ngoái thì uổng lắm.

Tiếp tục đọc