Thứ Tư, 5 tháng 4, 2023

tiềm năng của trí thông minh nhân tạo và ảnh chụp vệ tinh

mỗi ngày, vệ tinh quay quanh quỹ đạo Trái Đất vẫn gửi xuống hàng nghìn terabyte dữ liệu cảm biến từ xa
có những nỗ lực gọi vốn cộng đồng trên mạng Internet như openstreetmap đã xuất hiện từ năm 2004 và gọi được 5 triệu tình nguyện viên, nhưng vẫn chưa xong và gặp vấn đề chất lượng
kể cả bị giục thì phân tích vẽ bản đồ của con người sẽ cần thời gian
năm 2017 có 5000 tình nguyện viên làm việc vẽ bản đồ đường và nhà Puerto Rico sau cơn bão Maria và đã mất đến 1 tháng
những năm gần đây, những công nghệ trí thông minh nhân tạo đã xuất hiện để làm việc phân tích cảm biến từ xa này theo quy mô lớn


công ty Microsoft mới tuyên bố khoản đầu tư 10 tỷ đôla vào AI nhưng chưa phải nhà hậu thuẫn tài chính duy nhất, các công ty phố Wall hàng đầu đang tuyệt vọng mở khoá những nguồn lực để tăng trưởng và một số thị trường đang phát triển vừa chớm lên chính thống thì là thành phần ưu tú nhất
có một nền tảng công nghệ tài chính đặt trụ sở ở quận tài chính của thành phố New York đang hoạt động ấn tượng đến mức các đài CNBC, Wall Street Journal và CNN đều đang ca ngợi: Masterworks đã mở khoá tiềm năng cho nghệ thuật đương đại với 1.7 nghìn tỷ đôla trị giá hạng tài sản thay thế, trước đó chỉ bán cho các tỷ phú, thì Masterworks giúp mọi nhà đầu tư có thể nhảy vào thị trường béo bở này mà chỉ cần chi trả vài nghìn đôla
tại sao lại nghệ thuật?
một là nghệ thuật đương đại so với chỉ số SP500 thì đã sinh lãi hơn 131% trong 26 năm qua
hai là trong khi cổ phiếu và trái phiếu đã sụp đổ trong năm 2022 thì các nhà đầu tư vào Masterworks nhận được lợi nhuận từ 9% đến 36%
nhu cầu cao đến nỗi những chào bán trên Masterworks có thể bán hết veo chỉ sau vài phút

Khởi đầu
năm 1958 lần đầu tiên Mỹ thành công bay vào vũ trụ
năm 1959 cơ quan tình báo CIA mở chương trình corona với mục tiêu phát triển một vệ tinh chụp ảnh để thay thế máy bay gián điệp U2
năm 1960 một tên lửa Liên Xô đã bắn rơi một máy bay U2 ở độ cao 25 mét trên mặt nước biển, phi công Gary Powers bị bỏ tù ở Liên Xô trong nhiều năm
những ứng dụng cảm biến từ xa dân sự đầu tiên là liên quan đến thời tiết
từ năm 1960 Tyros và kế nhiệm Nimbus đã giúp gây dựng kiến thức khí tượng về Trái Đất, thường kỳ cung cấp ảnh chụp bề mặt địa cầu
năm 1972 Mỹ công bố những ảnh vệ tinh từ chương trình Landsat
chương trình Landsat căn bản đã làm nền tảng cho ngành cảm biến từ xa ngày nay, đã có nhiều vai trò: vẽ bản đồ, cháy rừng, dầu tràn trên biển, lớp phủ bề mặt, nông nghiệp, vận tải biển và giám sát chất lượng nước
những quốc gia khác đã mở chương trình riêng như năm 2014 châu Âu mở dự án Copernicus và năm 2013 Trung Quốc phóng vệ tinh Gaofen
chưa kể những hình ảnh vệ tinh được chụp bởi những công ty tư nhân như Maxar
Dữ liệu lớn những cảm biến từ xa
dự án Copernicus với những vệ tinh Sentinel 2A và 2B mỗi ngày sản xuất được 9.54 terabyte dữ liệu
dữ liệu không chỉ nhiều mà còn đa dạng, nhiều góc nhìn
đầu tiên ta có thể nhìn ảnh chụp dưới nhiều quang phổ: không chỉ ánh sáng nhìn thấy mà cả hồng ngoại, tử ngoại... được gọi là độ phân giải quang phổ
ví dụ có những hệ thống cảm biến từ xa sẽ chủ động dội sóng vô tuyến [radio] xuống bề mặt - căn bản không khác gì radar - những công nghệ sẽ hoạt động mà không chịu ảnh hưởng thời tiết và giúp vẽ bản đồ bề mặt sao Kim
dữ liệu cảm biến từ xa cũng có sẵn nhiều mức độ chi tiết: điểm ảnh [pixel] từ 100 km đến 1 cm - gọi là độ phân giải không gian
dữ liệu cảm biến từ xa cũng có sẵn nhiều tần suất thời gian - gọi là độ phân giải thời gian - độ phân giải thời gian càng cao thì vệ tinh càng bay qua chụp nhiều lần hơn

Đường ống
nghiên cứu về trí thông minh nhân tạo và học máy cho ngành cảm biến từ xa đang đi rất nhanh khắp chuỗi cung
dữ liệu hình ảnh cảm biến từ xa được xử lý, phân tích và tối ưu trong một loạt các bước: một đường ống [pipeline]
các nghiên cứu sinh áp dụng các kỹ thuật học máy và học sâu xuyên suốt đường ống này để mở khoá thêm giá trị
từ đầu thì công việc là lấy được dữ liệu ảnh chụp từ xa: vệ tinh, máy bay không người lái [UAV unmanned aerial vehicle] hay bất cứ hệ thống nào
sau đó ta xử lý qua những bước để cải thiện chất lượng của dữ liệu
ví dụ mặt nạ đám mây: mây làm hỏng ảnh chụp vệ tinh vì chặn góc nhìn và phủ bóng làm hỏng độ phân giải và gây lỗi phân tích dữ liệu
cho nên các nghiên cứu sinh đã tạo ra những thuật toán học sâu để tự động đánh dấu những khu vực có mây, lấy ra những khu vực quang mây để sử dụng tiếp xuyên suốt đường ống [pipeline]

Siêu phân giải
tuy nhiên một trong những bước xử lý được nghiên cứu kỹ nhất là liên quan đến cải thiện độ phân giải không gian của ảnh
phần lớn những ảnh vệ tinh cho công chúng tiếp cận đã bị giới hạn độ phân giải ở số điểm ảnh nhất định [pixel]: có thể vì hạn chế phần cứng là những cảm biến CCD vệ tinh hoặc khả năng truyền tải dữ liệu, hoặc hạn chế tài chính
một vệ tinh thường tốn cả tỷ đôla trọn gói
lý do có thể pháp luật, trong đó có những vấn đề an ninh quốc gia
độ phân giải thấp sẽ ảnh hưởng khả năng cho dữ liệu chạy tiếp trên đường ống, những bước như phát hiện vật thể, phát hiện thay đổi và phân loại hình ảnh
ví dụ những vật thể như ôtô có thể chỉ chiếm 10 pixel điểm ảnh trong một tấm ảnh vệ tinh, sẽ gây khó nếu nhiều ôtô san sát nhau
cho nên ta cần thêm điểm ảnh [pixel]
mạng lưới thần kinh nhân tạo có thể được sử dụng để dùng thuật toán để lấy được những ảnh có độ phân giải cao hơn từ những ảnh độ phân giải thấp - gọi là kỹ thuật 'siêu phân giải'
siêu phân giải là một vấn đề kinh điển trong ngành thị giác máy tính với 2 cách tiếp cận chung là một khuôn hình và nhiều khuôn hình
cách một khuôn hình, công trình đầu tiên đề xuất một cách tiếp cận học sâu cho siêu phân giải một khuôn hình đã ra mắt năm 2014
mạng lưới thần kinh tích chập siêu phân giải [srcnn super resolution convolutional neural network] được huấn luyện sử dụng một bộ huấn luyện những hình ảnh phân giải thấp và cao: điền vào những pixel bị mất từ ảnh phân giải thấp, với giả thiết rằng miếng vá những pixel chưa biết này sẽ có lẽ nhìn giống như miếng vá những pixel trước đó khác trong bộ huấn luyện
những công cụ này không phải độc nhất vô nhị
một công cụ dựa vào mạng lưới mới hơn có tên là Topaz Gigapixel để nâng cấp [upscale] hình ảnh
nhưng ảnh vệ tinh có những thử thách khác với những loại ảnh khác
ví dụ quy mô: vệ tinh chụp những ảnh bao quát rất rộng, hình ảnh chụp nhiều phạm vi tỷ lệ trong một khuôn hình
thứ hai là ảnh vệ tinh không có kết cấu [texture] tốt - vì độ phân giải không gian thấp và kỹ thuật nén dữ liệu - gây khó khăn để "xác định" cảnh
ví dụ nếu ta nâng cấp [upscale] lên 4 lần, cho mỗi pixel trong ảnh ban đầu thì ta cần tạo thêm 15 pixel mới
nếu pixel ban đầu bao quát một khoảnh 4x4 mét thì mỗi pixel trong số 15 điểm ảnh do AI tạo ra sẽ phải thể hiện một khoảnh 1x1 mét - rất nhiều chi tiết mà AI căn bản tự tạo ra - phần lớn các mô hình đều chưa sẵn sàng làm được chính xác
nhiều kỹ thuật siêu phân giải, thay vào đó, đã tập trung vào tăng nét các góc cạnh và các vật thể xác định được
nghiên cứu cho thấy rằng áp dụng những kỹ thuật siêu phân giải ảnh có thể cải thiện hiệu năng của một mô hình phát hiện vật thể lên đến 40%

Tổng hợp hình ảnh
cách thứ 2 để sản xuất những ảnh độ phân giải cao hơn là siêu phân giải nhiều khuôn hình - đôi khi cũng là kỹ thuật tổng hợp hình ảnh
trong bài viết "sức mạnh máy tính bên trong máy ảnh iPhone" đã nói đến cách những vi xử lý điện thoại ngày nay thực hiện cái gọi là "ảnh chồng lên nhau": máy ảnh lấy dữ liệu ảnh trước và sau khi người chụp bấm nút chụp và 'buộc' [lace] vào nhau để có được một bức ảnh chất lượng cao hơn
ảnh vệ tinh cũng làm thế: một phương pháp gọi tên là "pan-sharpening" - cảm biến vệ tinh thường chụp cũng một hình ảnh với những quang phổ khác nhau và ta có thể sát nhập những ảnh ấy với nhau thành một ảnh màu duy nhất có độ phân giải cao
pan-sharpening đã xuất hiện từ lâu và không cần công nghệ học sâu nhưng mạng lưới thần kinh nhân tạo đã được triển khai để cải thiện chất lượng của sản phẩm cuối
ví dụ mới đây người ta sử dụng một mạng lưới thần kinh nhân tạo để chú thích hình ảnh vệ tinh hiện đại bằng những chi tiết lấy từ những bản đồ cũ đã được quét lên thành dữ liệu kỹ thuật số

Những bước phân tích
phát hiện vật thể
chiết xuất vật thể
phân loại mục đích sử dụng hoặc lớp phủ trên đất
phát hiện thay đổi

Phát hiện và chiết xuất vật thể
phát hiện vật thể là AI tìm ra những thực thể của một vật thể ở trên hình ảnh: ví dụ nhận biết những thuyền và cầu, thường sẽ khoanh vùng những vật thể tìm được trong khung hình chữ nhật
chiết xuất vật thể thì khó hơn: mục tiêu là cô lập vật thể ra khỏi hình ảnh, như một con đường hoặc một hồ nước - AI cần biết những biên giới pixel của vật phẩm - khoanh khung hình chữ nhất thôi là chưa đủ
mạng lưới thần kinh nhân tạo đã đóng góp vai trò xử lý những vấn đề vật thể này: người ta đã sử dụng hình ảnh vệ tinh để theo dấu tảo mơ nở hoa trên biển - tảo nở hoa có thể dạt vào bờ
vấn đề của tảo nở hoa là tảo mơ nở hoa thành những lùm, thảm và mảng [bè / đống]
từ vũ trụ nhìn xuống, những tảo mơ nở hoa nhìn rất nhỏ
nếu ta sử dụng dữ liệu của những vệ tinh nhất định, ví dụ Modis, ngưỡng phát hiện là 0.2% của một điểm ảnh pixel - nghĩa là những máy phân loại cũ sẽ bỏ qua nhiều tảo mơ
công nghệ học sâu kết hợp với hình ảnh độ phân giải cao sẽ cho phép cải thiện độ chính xác chiết xuất lên đến 95% so với những máy phân loại cũ chỉ được 86%

Đường phố
phát hiện và chiết xuất đường tự động có thể rất hữu dụng trong những tình huống khẩn cấp, để biết được nơi xe có hoặc không thể đi qua
nhưng có một vấn đề kỹ thuật
đầu tiên là đường sẽ nhìn khác tuỳ thuộc nơi ta nhìn vào: một mô hình được huấn luyện bằng dữ liệu đường phố ở thành phố Las Vegas, Mỹ sẽ thất bại nếu dùng cho dữ liệu ảnh của thủ đô Khartoum, Sudan
thứ hai là ảnh vệ tinh chụp đường sẽ bị những biến tấu ảnh vì cây cối che khuất, bóng râm của các toà nhà, điều kiện thời tiết và bối cảnh đang diễn ra trên mặt đất
rồi xe chạy: dữ liệu ảnh của xe cũng có thể làm rối rắm thêm
thứ ba là ta cần biết thêm về con đường, hơn là chỉ có mỗi ảnh chụp: bao nhiêu làn, có cho xe ôtô chạy không, có hư hỏng gì không
mạng lưới thần kinh nhân tạo thì tốt hơn những phương pháp sẵn có, cả lợi thế và nhược điểm, tuỳ vào loại mạng lưới thần kinh nhân tạo cụ thể được áp dụng: tuy nhiên vẫn thiếu những phương pháp thủ công vì độ phức tạp của vấn đề và thiếu dữ liệu huấn luyện "tốt"
các nghiên cứu sinh đã ra mắt những bộ dữ liệu như DeppGlobe để giúp huấn luyện và sản xuất ra những cách tốt hơn để xác định và chiết xuất chuẩn xác hàng nghìn kilomet đường

Phân loại sử dụng/bao phủ đất
đất này là rừng, đồng cỏ, sông hồ nước, ruộng hay khu dân cư thành thị?
công nghệ rất hữu ích để xác định những mảnh ruộng canh tác trên vùng núi, giúp tiết kiệm chi phí và thấu hiểu sâu sắc hơn về kết quả của những chính sách kinh tế
nhưng nhược điểm là, mặc dù nỗ lực mời gọi cộng đồng đóng góp [crowdsourse], khó tìm được những bộ dữ liệu lớn được chú thích kỹ, phần lớn khu vực được chú thích thì nhỏ tầm 10 km
những chú thích cũng không đồng bộ: bộ dữ liệu này ghi là tràng cỏ [savanna] hoặc đồng cỏ cây bụi [open shrubland] thì bộ dữ liệu khác có thể xếp loại là đồng cỏ rừng rậm [wooded grassland] hoặc bộ dữ liệu khác nữa ghi là rừng hỗn hợp...
thế giới thì quá đa dạng nên các mô hình được huấn luyện trên những bộ dữ liệu của khu vực này sẽ không dễ áp dụng cho khu khác - tăng quy mô lên những khu vực rộng hơn sẽ khó
đã có những nỗ lực thành tựu với những mạng lưới thần kinh nhân tạo nhận biết những khu vực rộng lớn: mạng lưới thần kinh nhân tạo có thể nhìn vào những khối 5x5 đến 64x64 pixel để phân loại ở cỡ diện tích tầm trung
mạng lưới đã khá thành thạo ở diện tích cỡ trung, nhưng nhược điểm là ta gặp vấn đề bị quá hoặc thiếu phân mảnh, nghĩa là khác biệt giữa loại này và loại kia thì không quá khắt khe

Phát hiện thay đổi
mỗi điểm ảnh pixel chỉ bao phủ một ít mét vuông, một vệ tinh chỉ có thể lướt qua một lần mỗi lượt quay xung quanh Trái Đất - nên ta có độ phân giải thời gian
phát hiện thay đổi có những ứng dụng như: theo dấu phá rừng, tăng trưởng nông nghiệp, đánh giá ảnh hưởng của thảm hoạ tự nhiên như động đất, bão, cháy rừng, hoặc khám phá những triển khai quân sự mới, hoặc theo dấu động thái của địch trên chiến trường
thuở đầu, cách tiếp cận cho vấn đề phát hiện thay đổi là dựa vào điểm ảnh pixel - nghĩa là so sánh các pixel giữa 2 thời điểm và nhận biết thay đổi
khó ở chỗ: không phải thay đổi nào cũng hữu dụng hoặc liên quan đến ứng dụng - ví dụ mây, sương mù hoặc bụi xuất hiện thì đúng là "thay đổi" nhưng không liên quan gì nếu ta muốn ứng dụng là theo dấu động thái địch trên chiến trường
cách tiếp cận học sâu sẽ bao gồm 2 bước: đầu tiên là chồng 2 ảnh lên nhau và lấy ra điểm khác biệt
sau đó chọn ra những điểm khác biệt mà nó tin rằng ấy là những thay đổi thực sự có liên quan

Ứng dụng
ứng dụng của công nghệ này, về căn bản, là vô hạn
ví dụ ta có thể sử dụng AI để nhanh chóng tạo ra những bản đồ chính xác những con đường sử dụng được sau một thảm hoạ tự nhiên, hoặc theo dõi những mảnh ruộng ở nơi hẻo lánh để ước tính độ hiệu quả của một chính sách kinh tế
hoặc sử dụng ảnh vệ tinh chụp ban đêm để theo dõi phủ sóng đèn điện được bật, nhờ đó ước lượng mức tăng trưởng kinh tế
đã có một công trình bài viết của ngân hàng thế giới ước lượng mối quan hệ giữa ánh sáng đèn đêm và tăng trưởng kinh tế, nói rằng mỗi 1% tăng thêm GDP thì sẽ liên đới 1.55% tăng phủ sóng đèn điện bật ban đêm
một ảnh hưởng lớn nữa là từ cộng đồng mã nguồn mở: người ta đã sử dụng những công cụ học máy mã nguồn mở để phân tích dữ liệu ảnh miễn phí từ những chương trình như Landsat
nhiều dự án đã phân tích ảnh vệ tinh để đếm tàu chở dầu, cây, thuyền, xe, máy bay và công trình hạ tầng kỹ thuật [ultility]
một dự án đã sử dụng ảnh vệ tinh để phát hiện và đếm dân số hải cẩu
mới đây Nga xâm lược Ukraine thì những nghiên cứu cũng tạo ra được thông tin tình báo chiến sự cho quân đội cả 2 phe

Kết
một trong những thử thách lớn cho ngành cảm biến từ xa sử dụng trí thông minh nhân tạo là tìm cách xử lý và phân tích dữ liệu này mà không cần những bộ dữ liệu đã chú thích sẵn
đây được gọi là "học ít giám sát" [semi-supervised learning] hoặc "học không giám sát" [unsupervised learning]
ngày nay, dữ liệu có cả đống
xử lý quy mô lớn lượng dữ liệu ấy sẽ càng cần ít can thiệp con người càng tốt
những đường ống [pipeline] tự động sẽ cần phát triển thêm
rồi câu hỏi về phần cứng: những mô hình học sâu cho cảm biến từ xa có thể có hàng triệu tham số, cần những bộ gia tốc AI tiên tiến
tiềm năng của trí thông minh nhân tạo trong ngành cảm biến vệ tinh thì vô hạn nhưng cần phần cứng AI và những công nghệ để sản xuất ra chip

Không có nhận xét nào:

Đăng nhận xét