Sơ Lược hệ điều hành linux
20:01
HỆ ĐIỀU HÀNH
LINUX
Linux là một
hệ điều hành tựa Unix rất mạnh, linh động, dễ mở rộng và hoàn toàn miễn phí. Nó
được sử dụng hiệu quả trong nhiều lĩnh vực của tin học và những ứng dụng mới
đang được xây dựng cho Linux mỗi ngày. Trong bài này chúng ta tìm hiểu hệ điều
hành Linux với những nội dung sau:
Giới
thiệu về hệ điều hành Linux
Tổ
chức hệ thống
Qua
bài học này, chúng ta hiểu được những đặc điểm cơ bản và một số vấn đề về tổ
chức hệ thống của hệ điều hành Linux. Từđó chúng ta có một cái nhìn rộng hơn về
các hệ điều hành và có thể lựa chọn được cho mình một môi trường làm việc và
phát triển thuận lợi nhất.
Bài
học này đòi hỏi những kiến thức tổng quát về cấu trúc và tổ chức của hệ điều
hành.
I.
GIỚI THIỆU
Unix là một hệ điều hành thông dụng trên thế giới do được
nhiều hệ thống hỗ trợ. Hệ điều hành này tồn tại trên hầu hết các kiểu máy tính
kể cả máy tính cá nhân.
Linux là một hệ thống Unix tự do được hình thành từ một
đồ án giải trí của một sinh viên người Phần Lan : Linus Torvalds, lấy nguồn cảm
hứng từ Minix, một hệ thống Unix nhỏ do Andy Tanenbaum thiết kế. Tháng 10/1991
Linus Torvalds công bố version chính thức đầu tiên của Linux (version
0.02).
Ngày nay, Linux là một hệ thống 32-bits, multi-tasking,
multi-user, mạng...nó được cài trên phần lớn máy PC (có thể chung với những hệ
điều hành khác). Nó hỗ trợ đủ loại chương trình khác nhau như X Windows, TCP/IP,
C/C++GNU và những công cụ khác của GNU, thư điện tử, những công cụ với LateX
hoặc những tiện ích cho văn phòng (ApplixWare,
StartOffice).
Sự thành công của Linux dựa vào nhiều yếu tố như
:
Mã nguồn của hệ thống, cũng như của hạt nhân, các công cụ
lập trình cũng như phát triển đều được phân phối tự do.
Linux tương thích với một số lớn các chuẩn của Unix ở mức
độ mã nguồn, bao gồm những đặc tính của POSIX, system V, và
BSD.
Một số lượng lớn các trình ứng dụng Unix miễn phí có thể
sử dụng lại dưới Linux mà không cần mô tả lại.
Hệ thống Linux được thiết kế dựa trên bộ xử lý của Intel
và tận dụng được tất cả những chức năng của chúng.
Linux là một hệ điều hành bao gồm hạt nhân, bộ thông dịch
lệnh và nhiều trình tiện ích.
Hạt nhân quản lý những tài nguyên vật lý (như bộ xử lý,
bộ nhớ, thiết bị ngoại vi) và logic (như tiến trình, tập tin...). Hạt nhân được
tạo thành từ một tập hợp các thủ tục và hàm được thiết kế bằng ngôn ngữ C. Cấu
trúc của hạt nhân là nguyên khối và lớp.Người sử dụng thao tác với Linux thông
qua bộ thông dịch lệnh. Một trong những điểm đặc biệt của Linux là có nhiều
shell khác nhau.
II. TỔ CHỨC HỆ THỐNG
II.1 Hệ thống tập tin
Một trong những đặc điểm quan trọng của Linux là nó hỗ
trợ nhiều hệ thống tập tin. Điều này làm cho nó rất linh động và có thể cùng tồn
tại với nhiều hệ điều hành khác. Từ những phiên bản đầu tiên, Linux đã hỗ trợ 15
loại tập tin : ext, ext2, xia, minix, umsdos, msdos, vfat, proc, smb, ncp,
iso9660, sysv, hpfs, affs và ufs.
Trong Linux, cũng như Unix, hệ thống tập tin được truy
xuất thông qua một cấu trúc cây thừa kế đơn thay vì là các thiết bị xác định
(như tên ổ đĩa hoặc số hiệu của ổ đĩa). Linux thêm những hệ thống tập tin mới
vào cây này khi nó được thiết lập (mount). Tất cả hệ thống tập tin được thiết
lập vào một thư mục và được gọi là thư mục thiết lập.
Khi một đĩa được khởi tạo, trên đĩa được chia thành nhiều
partitions. Mỗi partition có một hệ thống tập tin. Hệ thống tập tin của Linux
coi những thiết bị khối một cách đơn giản như là một tập hợp tuyến tính các khối
mà không quan tâm đến tổ chức vật lý trên đĩa. Chương trình điều khiển thiết bị
khối chịu trách nhiệm ánh xạ khối cần đọc thành vị trí vật lý cụ thể trên
đĩa.
Trong hệ thống tập tin của Linux, người sử dụng không
quan tâm đến những khác biệt của chúng trên những thiết bị vật lý khác nhau. Hệ
thống tập tin không chỉ trên hệ thống cục bộ mà còn là những ổ đĩa từ xa trên
mạng. Ví dụ một hệ thống tập tin của Linux :
A E boot etc lib opt tmp
C F cdrom fd proc root var
D bin dev home mnt lost+found .....
Hệ thống tập tin đầu tiên Linux hỗ trợ là Minix cho phép
tập tin có tên tối đa là 14 ký tự và kích thước không vượt quá 64Mb. Hệ thống
tập tin đặc thù đầu tiên của Linux là ‘hệ thống tập tin mở rộng’ (EXT) được giới
thiệu vào tháng 4/1992, hệ thống này không hiệu quả nên sau đó vào năm 1993 ‘hệ
thống tập tin mở rộng thế hệ 2’ được thêm vào.
Có một điểm quan trọng khi hệ thống tập tin EXT được đưa
vào Linux. Hệ thống tập tin thật bị tách khỏi hệ điều hành và các dịch vụ hệ
thống bằng một tầng giao tiếp gọi là hệ thống tập tin ảo VFS. VFS cho phép Linux
hỗ trợ nhiều loại hệ thống tập tin khác nhau, mỗi loại được xem như là một giao
tiếp phần mềm với VFS. Tất cả chi tiết của hệ thống tập tin được chuyển đổi sao
cho chúng xuất hiện như nhau đối với phần còn lại của hạt nhân Linux và các
chương trình thi hành trong hệ thống. Lớp VFS cho phép thiết lập một cách trong
suốt nhiều hệ thống tập tin khác nhau cùng lúc. VFS được cài đặt sao cho việc
truy xuất các tập tin của nó nhanh nhất có thể và nó cũng đảm bảo tính chính xác
khi truy xuất.
VFS đặt các thông tin của mỗi hệ thống tập tin vào bộ nhớ
mỗi khi chúng được thiết lập và sử dụng. Các cấu trúc dữ liệu mô tả tập tin và
thư mục truy xuấtđược tạo và hủy thường trực. Khi các khối được truy xuất, chúng
được đặt vào vùng đệm. Vùng đệm không chỉ lưu giữ dữ liệu mà còn hỗ trợ quản lý
giao tiếp không đồng bộ với bộ phận điều khiển thiết bị
khối.
‘hệ thống tập tin mở rộng thế hệ 2’
EXT2
Là hệ thống tập tin thành công nhất của Linux. Hệ thống
này, cũng như các hệ thống tập tin khác, được xây dựng trên cơ sở các khối dữ
liệu. Các khối dữ liệu này có cùng kích thước và mọi kích thước tập tin được làm
tròn thành một số nguyên các khối này.
EXT2 định nghĩa hệ thống tập tin bằng cách mô tả mỗi tập
tin trong hệ thống bằng một cấu trúc I-node duy nhất và mỗi inode có một số để
định danh. Các I-node này được đặt trong bảng I-node. Các thư mục trong EXT2
được xem như những tập tin đặc biệt chứa những con trỏ đến các i-node của các
entry.
Hình 15.1 cho thấy tổng quan của hệ thống tập tin EXT2.
Hệ thống này chia những partitions mà nó quản lý vào các Block
Group.
II.2 Điều khiển thiết bị
Như đã đề cập trong phần quản lý nhập xuất, một trong
những mục tiêu chính của hệ điều hành là giúp cho người sử dụng độc lập với
thiết bị. Trong Linux, các thiết bị phần cứùng đều được xem như là các tập tin
thông thường : chúng có thể được mở, đóng , đọc , ghi, và sử dụng cùng những lời
gọi hệ thống để thao tác. Mọi thiết bị trong hệ thống đều được biểu diễn bởi các
tập tin thiết bị, ví dụ đĩa IDE đầu tiên của hệ thống được biểu diễn bởi
/dev/hda.
Linux ánh xạ tập tin thiết bị vào các lời gọi hệ thống.
Linux hỗ trợ ba loại thiết bị là : ký tự, khối và mạng. Có nhiều chương trình
điều khiển thiết bị khác nhau trong hạt nhân của Linux nhưng chúng cùng chia xẻ
những thuộc tính chung :
Mã nguồn của hạt nhân : chương trình điều khiển thiết bị
là một phần của hạt nhân và cũng như những đoạn mã nguồn khác nếu nó bị lỗi nó
có thể đe dọa nghiêm trọng đến hệ thống.
Chương trình điều khiển thiết bị cung cấp một giao tiếp
chuẩn với hạt nhân của Linux. Chúng sử dụng những dịch vụ chuẩn từ hạt nhân
này.
Hầu hết các chương trình điều khiển thiết bị của Linux
được nạp như những đơn thể của hạt nhân khi có yêu cầu và được gỡ ra khi nó
không còn được sử dụng nữa.
Khi khởi động hệ thống mỗi chương trình điều khiển thiết
bị được khởi tạo và nó sẽ tìm thiết bị phần cứng mà nó sẽ điều
khiển.
Linux sử dụng cơ chế DMA và sử dụng một vector cấu trúc
dma_chan để quản lý các kênh DMA (mỗi kênh có một vector).
Mỗi lớp điều khiển thiết bị : ký tự, khối, mạng cung cấp
những giao tiếp chung với hạt nhân. Khi một thiết bị được khởi tạo, thanh ghi
điều khiển thiết bị bên trong hạt nhân của Linux được thêm một entry trong
vector chrdevs của cấu trúc devive_struct. Một định danh(id) được xác định cho
vector này và là cố định. Mỗi entry trong vector chrdevs, một device_struct gồm
hai phần tử : một con trỏ đến tên của thanh ghi điều khiển thiết bị và một con
trỏ tới khối của tập tin thao tác. Khối của tập tin thao tác này là địa chỉ của
những thủ tục trong chương trình điều khiển thiết bị mà chúng kiểm soát những
thao tác như mở, đóng, đọc, ghi. Nội dung của /proc/devices cho các thiết bị ký
tự được lấy từ vector chrdevs.
Các thiết bị khối được truy xuất như những tập tin. Linux
quản lý các thanh ghi thiết bị khối bằng vector blkdevs, và tương tự như vector
chrdevs mỗi entry của nó là các cấu trúc device_struct nhưng có hai loại thiết
bị khối : SCSI và IDE. Mỗi chương trình điều khiển thiết bị khối phải cung cấp
một giao tiếp với vùngđệm cũng như những thao tác tập tin thôn thường. Cấu trúc
blk_dev_struct bao gồm địa chỉ của các thủ tục được yêu cầu và một con trỏ đến
những cấu trúc dữ liệu cần thiết, mỗi cấu trúc này sẽ đại diện cho một yêu cầu
từ vùng đệm cho những điều khiển đọc hoặc ghi một khối dữ
liệu.
Trong Linux, mỗi thiết bị mạng là một thực thể có thể
nhận hoặc gửi gói dữ liệu. Mỗi thiết bị mạng được biểu diễn bằng một cấu trúc
device. Các chương trìnhđiều khiển thiết bị mạng sẽ ghi nhận những thiết bị mà
chúng sẽ điều khiển trong quá trình khởi tạo mạng lúc khởi động hệ thống. Cấu
trúc device chứa những thông tin về các thiết bị và địa chỉ của các hàm hỗ trợ
những nghi thức và dịch vụ mạng khác nhau. Nhữõng hàm này chủ yếu tập trung vào
việc chuyển dữ liệu sử dụng các thiết bị mạng. các thiết bị sử dụng các cơ chế
hỗ trợ mạng chuẩn để chuyển dữ liệu nhận được cho lớp nghi thức thích hợp. Tất
cả các gói dữ liệu chuyển và nhận được biểu diễn bởi cấu trúc sk_buff, đây là
một cấu trúc linh động cho phép các tiêu đề (header) nghi thức mạng có thể dể
dàng thêm vào hoặc loại bỏ.
Cấu trúc device lưu những thông tin về thiết bị mạng :
tên, thông tin về đường truyền, cờ trạng thái giao tiếp(mô tả các thuộc tính và
khả năng của các thiết bị mạng), thông tin về nghi thức, hàng đợi gói tin(đây là
hàng đợi của các gói sk_buff chờ chuyển dữ liệu trên thiết bị mạng đó), các hàm
hỗ trợ (mỗi thiết bị cung cấp một tập hợp các thủ tục chuẩn được gọi bởi lớp
nghi thức).
II.3 Quản lý tiến trình
Mỗi tiến trình trong Linux được biểu diễn bằng một cấu
trúc dữ liệu task_struct (task có nghĩa là tiến trình trong Linux). Linux sử
dụng task vector để quản lý các con trỏ đến các task_struct, mặc định là có 512
phần tử. Khi một tiến trình được tạo ra, một task_struct mới được cấp phát trong
bộ nhớ và được thêm vào vector task. Linux hỗ trợ hai loại tiến trình là loại
bình thường và loại thời gian thực. Cấu trúc task_struct gồn những trường như
sau : trạng thái (thi hành, chờ, ngưng, lưng chừng), thông tin lập lịch, định
danh, thông tin liên lạc giữa các tiến trình, liên kết, định thời gian, hệ thống
tập tin, bộ nhớ ảo, ngữ cảnh.
Trong Linux cũng như Unix, chương trình và lệnh được thực
hiện theo cơ chế thông dịch. Bộ thông dịch được gọi là shell. Linux hỗ trợ nhiều
loại shell như sh, bash, tcsh. Tập tin thi hành có nhiều dạng, dạng được sử dụng
thông dụng nhất trong Linux là EFL, ngoài ra Linux cũng có thể hiểu được nhiều
dạng tập tin khác.
Các cơ chế thông tin liên lạc giữa các tiến trình được sử
dụng là tín hiệu (SIGNALS), đường ống (PIPE), sockets, semaphore và bộ nhớ chia
xẻ.
Có một tập hợp các tín hiệu được định nghĩa trước, các
tính hiệu này có thể được phát sinh bởi hạt nhân hoặc những tiến trình khác
trong bộ nhớ. Linux cài đặt các tín hiệu trong task_struct. Không phải mọi tiến
trình trong hệ thống có thể gửi tín hiệu đến mọi tiến trình khác. Tín hiệu được
phát sinh bằng cách thiết lập một bit thích hợp trong trường signal của cấu trúc
task_struct. Tín hiệu không xuất hiện cho tiến trình ngay khi nó được tạo mà
phải chờ đến khi tiến trình được thực hiện trở lại.
Trong Linux cơ chế đường ống cài đặt sử dụng hai cấu trúc
file trỏ đến cùng inode VFS tạm thời xác định một trang vật lý trong bộ nhớ. Khi
tiến trình ghi thực hiện việc ghi vào đường ống, các byte sẽ được chép vào trang
dữ liệu chia sẻ. Linux phải đồng bộ quá trình truy xuất trong đường ống. Tiến
trình ghi sử dụng các hàm thư viện ghi chuẩn.
Các cơ chế socket, semaphores và bộ nhớ chia sẻ của Linux
gần giống với hệ thống Unix System V.
II.4 Quản lý bộ nhớ
Linux hỗ trợ hệ thống chia sẻ bộ nhớ IPC (Inter Process
Communication- thông tin liên lạc giữa các tiến trình) của Unix System
V.
Linux sử dụng bộ nhớ ảo và
cơ chế phân trang. Trên hệ thống Alpha AXP một trang có kích thước 8Kb và trên
hệ thống Intel x86 một trang có kích thước 4Kb. Chiến lược thay trang được áp
dụng là LRU.
Linux có số cấp bảng trang tùy vào các nền khác nhau
(Alpha 3, Intel x86 2). Bảng trang sẽ được chuyển thành các tiến trình đặc thù
trên các nền khác nhau,điều này giúp cho việc thao tác trên bảng trang không lệ
thuộc vào các nền này.
Linux sử dụng thuật toán
Buddy để thực hiện việc cấp phát và thu hồi các khối của trang. ( 1 khối = 1, 2,
hoặc 4 trang...)
0 nhận xét