Skip to main content

Posts

Showing posts from 2011

Resources for the next generation of scientists and engineers

There are many good materials, free ebooks, lectures, ... but here is a few of things come with me many years when I started learning "Hello World" in Computer Science. Thanks to Google University (I have started using Google since 2004) the Foundations, Foundations of Computer Science http://infolab.stanford.edu/~ullman/focs.html Introduction to Programming in Java http://introcs.cs.princeton.edu/java/home/ Algorithms, 4th Edition http://algs4.cs.princeton.edu/home/ http://www.cs.princeton.edu/courses/archive/fall11/cos226/lectures.php http://www.cs.princeton.edu/~wayne/kleinberg-tardos/ Advanced level: Mining of Massive Datasets http://infolab.stanford.edu/~ullman/mmds.html Agile Patterns: The Technical Cluster (a good engineer should understand both theory and practice) http://www.infoq.com/minibooks/agile-patterns Networks, Crowds, and Markets:Reasoning About a Highly Connected World http://www.cs.cornell.edu/home/kleinber/networks-book/ for self-study student

Think and Make it happen

dedicate these words to someone is reading my blog :) Navigate the waters of your inner self with emotion.  Turn the simple things into a spectacle for the eyes.  Never give up on life or on those you love. Never grow old in the territory of emotion! Disappointment, frustration, and loss will always occur, But work through each pain as an opportunity  to grow. Find an oasis in each your desserts! Contemplate beauty. Unleash creativity. Manage your thoughts. Protect your emotions. Live in enterprising lifestyle. Train your amazing mind to be brilliant. You deserve it!

Play with Akka, better & scalable concurrency model for Java

You have a cool algorithm to compute relationship between your friends and your hobbies, interests. You want to scale it to 10 million users (scalability). blah ..blah ... Here is the ideas (functional programming - Haskell, Erlang , map&reduce - Hadoop,Google ,  Actor Pattern - Akka framework )  The Actor Model - Towards Better Concurrency View more presentations from Dror Bereznitsky

Play with OAuth for FPT API, Twitter API, Picasa API on Android

Cool, some my new projects is building some sharing tool for Android platform Just learning now, share and twitting my photo shot, location in real-time. small project for fun http://schwiz.net/blog/2011/using-scribe-with-android/ http://nilvec.com/implementing-client-side-oauth-on-android/ http://donpark.org/blog/2009/01/24/android-client-side-oauth http://code.google.com/apis/accounts/docs/MobileApps.html

Active Info Graph

Graph is the beautiful data structure both in Computer Science and Maths, I love this when first got some basic ideas in school. One of the best ways to innovate is  forgetting all things you have learned in school or trap yourself in the mind someone  already make it happen ? Here some academic writings (and maybe Google, or big guys implemented this ???) http://videolectures.net/slsfs05_hofmann_lsvm/ http://en.wikipedia.org/wiki/Tf%E2%80%93idf  (in Lucene  http://lucene.apache.org/java/docs/index.html ) what I can dream Small World Phenomenon ( http://introcs.cs.princeton.edu/java/45graph/ ) http://www.amazon.com/Computer-Brain-John-Von-Neumann/dp/0300007930 Case study In the passive info world, I have to google to search for some useful things E.g:  http://www.vietnamworks.com/jobseekers/searchresults.php?search=true&industry=35&gclid=CM_Y3MSz7JICFQgaewodSE5zwg&lang=2 Captured from vietnamworks Can this info actively come to me ? 

Data Scientist - Books, Links, Papers, Tools, Projects,

on the way to prepare & study for new job, new trends after the post web 2.0 era. I still think about what should I do, study, research , blah.. blah ... to be a Data Scientist , ya truly science job. In the trend where the data generated from massive users, tons of data is everywhere. Blog, Facebook, YouTube, Twitter, ... We have to deal with them everyday. Your physical brain is designed to processing a lot of news, information, work ,,.. at same time for filter what is useful information , the knowledge you should capture and then the Wisdom ( http://www.systems-thinking.org/dikw/dikw.htm ) =>Stress, overloaded, ... or the limit of biological brain. On the way to implement my idea "My Second Brain" project  http://code.google.com/p/my-second-brain/ http://www.infogineering.net/data-information-knowledge.htm As the name, it should help me processing tons of email, blogs, RSS , local news to find the keywords , the trends. That can save me time manually

Big Data & My second brain project

Những thông tin dự báo xu hướng mà chúng ta nên xem qua: http://www.readwriteweb.com/archives/life_in_the_future_with_data_livestreaming_oreilly.php http://www.mckinsey.com/mgi/publications/big_data/index.asp Trong thời kì hậu Web 2.0 này (post-web2.0 era) , việc xử lý & phân tích các dữ liệu mà bất kì ai, những user như mình (Facebook, Google, Banbe, Gmail, Picasa Photo, Youtube, ....) quá nhiều và cực kỳ phân mảnh rải rác khắp nơi. Sự thật là: Bạn có bao giờ đối mặt với chuyện đi tìm cái link về private data (những data mà Google không thể index duoc vì 0 có password)  về công việc, 1 địa điểm ăn uống trên internet, hay 1 bức mail trong Gmail, 1 cái feed ban share từ Facebook, 1 tấm hình mà bạn của bạn tag vào, ... Những dữ liệu mang tính riêng tư cao , được "cất giấu", lưu trữ đâu đó trong các dịch vụ Web mà bạn sử dụng. Vì tính riêng tư như vậy , chả ai muốn Google index nó và phơi ra cho public. Nhưng nhu cầu tìm kiếm là có, bạn có thể dùng search của FB để

Info Marker Extension cho Google Chrome

Thỉnh thoảng bạn đi lướt web đâu đó, bạn bắt gặp những thông tin hay, hữu ích cho cá nhân, bạn đánh dấu nó lại (bookmark), và tất nhiên sau đó chia sẻ cho một ai đó sẽ làm chúng ta trở lên vui hơn. Ước muốn là chúng ta chỉ cần 1 cái Browser + 1 cái nút để đánh dấu nó lại lên 1 trang profile cá nhân ở mạng xã hội nào đó, hoặc 1 bài blog, hoac 1 nơi lưu trữ dễ dành xem lại khi cần. Info Marker được tạo ra như 1 nhu cầu cá nhân của bản thân mình, chỉ 1 cái nút nhỏ, và nó nhúng vào bất kỳ 1 trang web nào đó, thế là hành động "chia sẻ", "thích" 1 thông tin trở nên thật đơn giản chỉ với 1-2 cái click chuột. Với version đầu tiên alpha 1, được tích hợp với dùng social plugins mạng xã hội banbe.net, và G+ button của Google Plus. Bạn có thể download, cài đặt ở đây và dùng thử http://dl.dropbox.com/u/4074962/chrome-ext-plugins.crx Định hướng của Info Marker sẽ đi từ Browser web đến mobile web, nơi mà những chiếc điện thoại thông minh sẽ trở thành công cụ ghi nhận, v

Simplicity of the Universe

my Ubuntu desktop

Imagine and keep it simple (Hãy tưởng tượng và giữ nó đơn giản)

Trước hết, tôi xin kể một kinh nghiệm nhỏ như sau Như chúng ta đã biết, Prof. Einstein là một nhà khoa học đáng kính, người đã thay đổi chúng ta về cách hiểu về vũ trụ, năng lượng và vật chất. Nhưng vì sao Prof.Einstein có thể giải quyết nhiều vấn đề phức tạp như vậy. Đơn giản là về phương pháp suy nghĩ, tư duy và giải quyết vấn đề Phát thảo vấn đề ở mọi nơi có thể Học theo cách ghi note của John Nash, và Mark Zuckenberg 1 bản design của hệ thống search engine cool hơn Google đây Cuốn "Khảo lược Adam Smith" khá hay về kinh tế" Trí tuệ đám đông nói lên những bí mật đằng sau thuật toán PageRank của Google Blackboard là 1 người bạn tốt

What we can see after the Web 2.0 era

(Bài blog này dành cho những cho những người như tôi, mong muốn  biến dịch vụ điện toán thế hệ post Web 2.0 trở nên gần gũi và giúp ít nhiều hơn với người dùng end-user.) When 2.0 was a buzz word for years, the technologies have been evolved rapidly, and I think we can adapt these techs in a small enterprise. The technologies, cloud computing platform (E.g: Google Office Docs and Google Data API), open source frameworks (E.g: Apache Projects, PHP CodeIgniter, ...), could be cheap solution for Enterprise Information System. As an engineer in a start-up company, I must always improve my skills, more agile for working, thinking and dealing with an uncertain world. Yes, everything can change day by day. In this 2010, the open source community have see the acquisition of Sun and Oracle, One is the symbol of innovation in IT in 1990s, Sun Micro-system and one is the " proprietary company", Oracle. MySQL as the database solution for cheap storage in Web 2.0 era has been

Ensuring Product Quality at Google

InfoQ: Ensuring Product Quality at Google “ we rarely attempt to ship a large set of features at once. In fact, the exact opposite is often the goal: build the core of a product and release it the moment it is useful to as large a crowd as feasible, then get their feedback and iterate,”

How to scan ISBN and post your book to blogger

When I need to find a book in my library, it's so boring  because it's not there. So I should do something that make my life easier with my Droid. Every book has a ISBN number, which's encoded in barcode, just like this one. You can see here, my book "Dealing with Darwin" has ISBN 971591842149. Step 1: I  write a small Android app "OrganizeMyStuff" , call to the Barcode Scanner App in my phone. Step 2: Got the ISBN number, then my app search it from the Google Book. Step 3: Finally, my app posts the book data to blogger. You can see at this  http://mybooks-database.blogspot.com/ That's it.

VietnameseAnalyzer.rb

require 'unicode' # Normalizes token text to lower case. class UnicodeLowerCaseFilter def initialize(token_stream) @input = token_stream end def text=(text) @input.text = text end def next() t = @input.next() if (t == nil) return nil end t.text = Unicode.downcase(t.text) return t end end class VietnameseAnalyzer < Ferret::Analysis::Analyzer include Ferret::Analysis # Standard Character mappings to remove all special characters # so only default ASCII characters get indexed CHARACTER_MAPPINGS = { ['á','à','ạ','ả','ã','ă','ắ','ằ','ặ','ẳ','ẵ','â','ấ','ầ','ậ','ẩ','ẫ'] => 'a', ['đ'] => 'd', ['é','è','ẹ','ẻ','ẽ','ê','ế','ề','ệ','ể','ễ'] => 'e', ['í','ì','ị&

Play with Mac OS X on my old PC

From Thoughts & Works & Life Số là dù không ưa gì Mr.Jobs này, và mấy tên iFans nhưng Mac OS và iOS là những hệ điều hành hay, và phải công nhận viết App cho iPhone thì dễ dụ mấy tên iFans mua hơn. Với Android thì ta nên sử dụng mô hình Free with Ads . Mỗi platform đều có cái hay và dở. Nhưng nếu ý tưởng  "Drive Safe" ra đời, tốt nhất là support luôn cả 2. HTML5 chính là key. Tuy nhiên framework cho 2 platform này vẫn còn thiéu, và mình sẽ là 1 cái.

I'm studying Scala - a COOL hybrid Object Oriented and Functional programming language

My idea is "Using Blogger as Storage for semantic and self-descriptive document". Just a small module in my own open source project  http://code.google.com/p/job-online-engine/ I found Scala is more cool language, true FP for my need. Well, learning now.