Skip to main content

Big Data, siêu thị Coopmart, METRO, Google , Facebook, ...



Câu chuyện bắt đầu bằng những câu hỏi: 
Vì sao các siêu thị chúng ta hay đi có đăng ký thẻ khách hàng thân thiết thì sẽ giảm giá ?
Vì sao đi Metro thì buộc phải có thẻ khách hàng ?
Làm thế nào các "thần bài" có thể tối ưu chiến lược trong mỗi 1 ván bài , mục tiêu thua ít, ăn nhiều ?


Hãy nghĩ, khi chúng ta đăng ký thông tin , bạn sẽ phải điền tất cả thông tin cá nhân tên, tuổi, số mobile, và nhà ở .... => số ID của khách hàng
=> lúc tính tiền tiền thì check thẻ
=> tất cả thông tin về đơn hàng sẽ lưu lại.
=> dùng phần mềm để thống kế dữ liệu, VD: nhóm các sản phẩm khách hàng thường mua chung => sắp các quày hàng kế nhau, ...
Nếu số lượng ít thì làm bằng thủ công cũng OK, nhưng cả 1 siêu thị khổng lồ như Metro, BigC với cả chục ngàn mặt hàng thì rất khó




Các quy trình quan sát những thói quen, những suy nghĩ và hành động mua hàng ? 
=> Thu thập, quan sát
=> Lưu dữ liệu
=> Thống kê => các "thông tin ẩn" bên trong
=> Đưa ra mô hình xác xuất để tối ưu việc chúng ta bị dính "bẫy" sẽ mua 1 món hàng gì, đó...
=> tóm lại, tất cả dữ liệu chúng ta mua hàng sẽ được track lại nhằm đưa ra
1) công thức để bán hàng tốt hơn (Optimized Marketing), nhà sản xuất sẽ biết nhu cầu khách hàng cụ thể cho từng điểm
2) mô hình "kiến trúc lựa chọn theo thói quen" (Choice architecture  ) , đó là cách thức các nhà marketing "thuốc" vào tất cả giác quan mà chúng ta có thể thấy, nghe, ngửi, sờ, nếm ... nhằm khiến ta "phải" mua 1 thứ gì đó.


Quy luật "đám đông" hay cách Việt Nam hay gọi là "sức mạnh nhân dân", 

Làm sao Google xếp hạng các trang web theo quy luật cực kì đơn giản, 1 trang web được xem hạng cao nếu có nhiều liên kết URL tới nó. (PageRank)
Câu chuyện bằng đầu vào những năm 1995, các trang web được tạo ra chủ yếu được gắn links bằng tay. (con người) là chính, vì vậy, khi xếp các links vào trang, đồng thời người ta đã 1 phần nào đó xếp hạng dùm Google các trang web. Vì vậy, ngoài việc search theo keywords như các search engine thời đó, Google đã "lơi dụng" con người như đánh dấu các metadata (các dữ liệu mô tả về trang) cho trang web.
=> thống kê + đưa ra các xác xuất theo keywords cho tất trang web.
=> better search engine ??



Phân tích dữ liệu của "đám đông"
Khi Tim Berners-Lee  dự đoán về 1 tương lai của Web , ông chỉ xem Web 2.0 như là 1 "hiện tượng" thay vì là bước  đệm để con người tiến vào thời đại của "semantic web" như ông đã nghĩ.
Thật sự các mô hình phát triển web hiện tại thực hiện một 1 mục tiêu căn bản là "kết nối" dữ liệu tri thức, các thông tin của mỗi cá nhân trên trên thế giới này thay vì "close" như 1 hệ thống thông tin cục bộ của 1 công ty gì đó.
Facebook không thể đơn ra các mô hình quảng cáo nếu các công nghệ hiện tại vá các nghiên cứu đã có sẵn để làm 1 việc là "bán quảng cáo" với số lượng cực lớn, giá rẻ, và tốt hơn các trang web truyền thống.
=> 100 tỉ đô là IPO  == 800 triệu users ?
ý tưởng nhưng Facebook người ta đã nghĩ ra từ thời kỳ xa xưa khi mới có Internet , Internet được tạo ra để chia sẻ dữ liệu và kết nối tất cả như 1 cỗ máy tính khổng lồ.
Vì vậy, thông tin chia sẻ có thể là hình, status, ... và mọi người connect nhau bởi những thứ đó.


Để kết thúc bài post này, mình có vẽ đại 1 cái hình hơi trừu tượng 1 tí ở đây (toán học luôn trừu tượng, chỉ có thành product  là dễ tưởng tượng @_@ ):
thế giới nhỏ (Small-world_network)  được tạo thành từ các cấu trúc topo , trong đó để thực hiện được các hành động hoặc trạng thái số 3, cần làm các bước ở số 2, và tương tự số 1.
VD: (1) phải có Internet, (2) mới có  Facebook, (3) rồi có quảng cáo

Comments

Popular posts from this blog

Netty Cookbook - free ebook for Java Developer

Introduction Netty.io is a popular open source library that greatly simplifies the development of network applications on top of the JVM.  It abstracts the burden to deal with tedious low level details and allows you to concentrate on your business logic instead.  It is used by high profile companies like Red Hat, Twitter or Facebook and designed from the ground up to handle high throughput at low latency, even with thousands of connections at the same time. In this book, you are going to build both client and server using netty best practices, which are communicating with each other in a completely asynchronous fashion.  We are going to explore the netty pipeline, how you can reuse existing protocol handlers and how to write your own. Source code for book  https://github.com/trieu/netty-cookbook Table of Contents Chapter 1: Communicating in Asynchronous World with Netty (15 pages) Introduction Recipe 1.1 Building an asynchronous TCP server and client Recipe 1.

Vì sao chúng ta cần ứng dụng Dataism cho đời sống

Dataism là một triết lý cho rằng dữ liệu là nền tảng của thực tại.  Theo triết lý này, dữ liệu là thứ tạo ra mọi thứ, từ các sự kiện trong thế giới thực đến suy nghĩ và cảm xúc của con người. Trong bối cảnh cuộc cách mạng công nghiệp 4.0 và sự phát triển mạnh mẽ của công nghệ thông tin. Tên gọi "Dataism" được đặt ra để mô tả một quan điểm cho rằng dữ liệu, đặc biệt là dữ liệu số và thông tin, chính là một nguyên tắc lớn trong tự nhiên và xã hội. Nguyên gốc của Dataism không thể được liên kết chặt chẽ với một cá nhân hay tổ chức cụ thể, nhưng một số tác giả và nhà nghiên cứu nhất định đã đóng góp vào việc phát triển và mô tả triết lý này. Một số tác giả nổi tiếng trong lĩnh vực này bao gồm: Yuval Noah Harari: Tác giả của cuốn sách nổi tiếng "Sapiens: Lược sử loài người" và "Homo Deus: Lược sử tương lai", Harari đã đề cập đến khái niệm Dataism trong việc mô tả sự tiến hóa của con người và xã hội.  https://dataethics.eu/humanism-dataism-future-scenario/ Wiki

Các lý thuyết tâm lý học cổ điển về động lực sống của con người

Hôm nay, mình viết 1 bài post tóm tắt theo kiến thức cơ bản về tâm lý học, theo những gì mình đã đọc + kinh nghiệm sống của cá nhân mình.  sự thật thú vị là Sigmund Freud là thầy của Carl Jung và Adler. Điểm chung:  cả 3 Bác đều tập trung nghiên cứu về các nguyên lý cơ bản mà tâm trí, ý thức của con người hoạt động.  Bản chất là các dữ liệu trong bộ não, ở trạng thái vô thức ảnh hưởng trực tiếp đến cách con người nhận thức về thế giới xung quanh họ, bao gồm cả đạo đức, cách suy nghĩ, cảm xúc và ý chí.  Một người không thể hành động mà không có 1 động lực tác động trong suy nghĩ của họ, nó phải có nguyên nhân. Hầu hết các nguyên nhân nằm trong mode "vô thức", bạn rất ít khi tự nhận ra chúng  Điểm khác biệt và đặc trưng: 1) #SidmundFreud  mô hình tâm lý của Freud tập trung vào  1.1 cõi vô thức con người,   1.2 tình dục và động lực sinh sản là năng lượng chính trong cõi vô thức 1.3 các chấn thương tâm lý nhưng bị ý thức kiềm chế lâu ngày 1.4 các ham muốn (như ham muốn tình dục)